求推荐一款好用的分词系统

明月惊鹊 发布于 2013/05/01 14:51
阅读 2K+
收藏 4

在osc里也搜索过一番了,折腾了中科院那hi CTCLAS,发现它不能在用户词典里添加子串,比如:

大够亿
大够

这样可以导入“大够亿”,但是“大够”并不能成功导入,

盘古分词是c#的,用c来调用它?还得装一个.net,呵呵 呵呵。

我的问题是: 求各位大牛说说用过什么分词系统?有什么特点嘛?

加载中
0
mark35
mark35
试试 scws
0
宏哥
宏哥

引用来自“mark35”的答案

试试 scws
差不多两年前就说这个分词一流 被吊饰们喷死 大多少都是蠢驴,只有这个解释
南瓜太郎
南瓜太郎
无语了 ,那有什么好的分词系统或者技术?
0
狮子的魂
狮子的魂

java版本, jcseg:  http://www.oschina.net/p/jcseg

C版本, friso: http://www.oschina.net/p/friso

PHP版本, robbe: http://www.oschina.net/p/robbe

都是基于mmseg算法,可以试试...

0
狮子的魂
狮子的魂

引用来自“宏哥”的答案

引用来自“mark35”的答案

试试 scws
差不多两年前就说这个分词一流 被吊饰们喷死 大多少都是蠢驴,只有这个解释
同意
0
scugxl
scugxl

写毕设尝试了很多分词,比如jcseg,paoding,lucene自带的中文分词,最终感觉还是IKAnalyzer2012好用的 注意是2012不是3.X哦


0
明月惊鹊
明月惊鹊
感谢各位大牛的指教!感谢国家!感谢osc! 
0
南瓜太郎
南瓜太郎
看到上面有很多的分词软件,有什么现在是最好的?
0
南瓜太郎
南瓜太郎

引用来自“狮子的魂”的答案

java版本, jcseg:  http://www.oschina.net/p/jcseg

C版本, friso: http://www.oschina.net/p/friso

PHP版本, robbe: http://www.oschina.net/p/robbe

都是基于mmseg算法,可以试试...

不错了 能够再详细对比说明下嘛?
0
狮子的魂
狮子的魂

引用来自“南瓜太郎”的答案

引用来自“狮子的魂”的答案

java版本, jcseg:  http://www.oschina.net/p/jcseg

C版本, friso: http://www.oschina.net/p/friso

PHP版本, robbe: http://www.oschina.net/p/robbe

都是基于mmseg算法,可以试试...

不错了 能够再详细对比说明下嘛?

后面的网址有详细的说明,都是使用一样的算法。

返回顶部
顶部