结巴分词:做最好的Python中文分词。 此次release包含以下更新: 1. 修改了代码缩进格式,遵循PEP8标准 2. 支持Jython解析器,感谢 @piaolingxue 3. 修复中英混合词汇不能识别数字在前词语的Bug 4. 部分代码重构,感谢 @chao78787 5. 多进程并行分词模式下自动检测CPU个数设置合适的进程数,感谢@linkerlin 6. 修复了0.3版中jieba.extra_tags方法对whoosh模块的错误依赖
评论删除后,数据将无法恢复
结巴分词 0.31 发布,Python 中文分词组件
结巴分词:做最好的Python中文分词。
此次release包含以下更新:
1. 修改了代码缩进格式,遵循PEP8标准
2. 支持Jython解析器,感谢 @piaolingxue
3. 修复中英混合词汇不能识别数字在前词语的Bug
4. 部分代码重构,感谢 @chao78787
5. 多进程并行分词模式下自动检测CPU个数设置合适的进程数,感谢@linkerlin
6. 修复了0.3版中jieba.extra_tags方法对whoosh模块的错误依赖