结巴分词 0.32 发布,Python 中文分词组件

fxsjy
 fxsjy
发布于 2014年02月07日
收藏 25

结巴分词:做最好的Python中文分词。

此次release包含以下更新:

1. 新增分词控制选项:可以关闭新词发现功能;详见:https://github.com/fxsjy/jieba/blob/master/test/test_no_hmm.py#L8

2. 修复词性标注子模块的Bug;详见: https://github.com/fxsjy/jieba/issues/111 https://github.com/fxsjy/jieba/issues/132

3. ChineseAnalyzer提供了更好的英文支持(感谢@jannson),例如单词Stemming; 详见:https://github.com/fxsjy/jieba/pull/106

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 OSCHINA 社区 [http://www.oschina.net]
本文标题:结巴分词 0.32 发布,Python 中文分词组件
加载中

最新评论(3

itfanr
itfanr

引用来自“张亦俊”的评论

JB分词

jb v5
张亦俊
张亦俊
JB分词
返回顶部
顶部