jcseg 1.7.0版发布了

狮子的魂
 狮子的魂
发布于 2012年10月27日
收藏 3

jcseg 1.7.0版发发布了。

1。词库整合了《现代汉语词典》和cc-cedict词库的所有词条。

2。增加了词条的同义词功能。只要在词库词条中加入该词的同义词集合,在jcseg.properties中配置加载同义词,jcseg会自动将同义词加入到分词结果中。(当然也可以配置不加载同义词,节省内存)。jcseg新词库

3。增加了词条的拼音功能。只要在词条中加入该词的拼音(目前所有的词条都已经标注上了拼音),在jcseg.properties中配置加载词条拼音。jcseg会自动将拼音加入到分词结果中。

4。新增了”中文数字“和”中文分数“的识别,例如:十分之三,一千三,五千零三十二。并且jcseg会自动将其转换成阿拉伯数字加入到分词结果中。

例如上述数字会转换为:3/10,1300,5032。

5。更好的英文处理,自动识别电子邮件地址,网址,小数,分数,百分数...。

6。自动半角和全角的转换。


google code:http://code.google.com/p/jcseg/

下载jcseg:http://code.google.com/p/jcseg/downloads/list

oschina:http://www.oschina.net/p/jcseg

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 OSCHINA 社区 [http://www.oschina.net]
本文标题:jcseg 1.7.0版发布了
资讯来源:jcseg开发者
加载中
返回顶部
顶部