ansj 中文分词 5.0.1 发布 - 开源中国社区
ansj 中文分词 5.0.1 发布
ansj 2016年07月30日

ansj 中文分词 5.0.1 发布

ansj ansj 发布于2016年07月30日 收藏 69

腾讯云 十分钟定制你的第一个小程序>>>  

ansj中文分词是一个完全开源的,基于google语义模型+条件随机场模型的中文分词的java实现.具有使用简单开箱即用等特点。分词速度达到每秒钟大约100万字左右(mac air下测试),准确率能达到96%以上.

更新内容:

  1. 需改歧义词典的格式,修复%作为量词存在

  2. 对新词的新词发现提供了词性分析功能,不再词性全部标注为nw

  3. 重新训练新词发现模型,针对机构名做了大量调优,

测试地址:http://www.nlpcn.org/demo.jsp



本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:ansj 中文分词 5.0.1 发布
分享
评论(1)
最新评论
0
好,不错,有更新了
顶部