- 分享
- 0
- 人气
- 0
- 主题
- 6
- 帖子
- 548
- UID
- 99797
- 积分
- 397
- 阅读权限
- 15
- 注册时间
- 2007-9-17
- 最后登录
- 2015-7-15
- 在线时间
- 4635 小时
|
本帖最后由 weeming21 于 2011-7-7 11:46 PM 编辑
回复 8# 宅男-兜着走
不需要转成区位码,分词后直接进 match 应该就可以了吧,不过dedecms的分词好像只支持 gbk
这就要看你站点的中文是用gbk还是utf8了
utf8 example- <META http-equiv="Content-Type" content="text/html; charset=utf8" />
- <?php
- require("lib_splitword_full.php");
- $str = "这里是你要的分词系统";
- iconv( 'UTF-8', 'gb2312//IGNORE' , $str);
- $sp = new SplitWord();//实例化
- $dd =implode(" ",array_unique(explode(" ",iconv( 'gb2312', 'UTF-8//IGNORE' , $sp->SplitRMM($str)))));
- echo $dd;
- ?>
复制代码 其实市面上还有其他的分词,discuz也有一个分词,但是是live的,要connect到discuz.net去进行分词
如果你有服务器权限,或者能自定义.so,那么可以选择这个分词系统,速度快
http://www.hightman.cn/index.php?scws |
|