"结巴"中文分词:做最好的Python中文分词组件。此release主要包含以下两点更新:1) 将词典文件dict.txt排序后存储,提升了Trie树构建速度,使得组件初始化时间缩短了10%;2) 增强了人名词语的训练,增强了未登录人名词语的识别能力
评论删除后,数据将无法恢复
结巴 0.17 版发布 Python中文分词组件
"结巴"中文分词:做最好的Python中文分词组件。
此release主要包含以下两点更新:
1) 将词典文件dict.txt排序后存储,提升了Trie树构建速度,使得组件初始化时间缩短了10%;
2) 增强了人名词语的训练,增强了未登录人名词语的识别能力