HanLP 1.8.5 现已发布。HanLP 面向生产环境的多语种自然语言处理工具包,基于PyTorch和TensorFlow 2.x双引擎,目标是普及落地最前沿的NLP技术。
HanLP具备功能完善、精度准确、性能高效、语料时新、架构清晰、可自定义的特点。借助世界上最大的多语种语料库,HanLP2.1支持包括简繁中英日俄法德在内的130种语言上的10种联合任务以及多种单任务。
新版本具体更新内容如下:
- 修复mini二元文法在JRE初始化后第一次分词可能出现的不一致 fix: #1851 (comment)
- 修复ViterbiSegment分词器中加载自定义词典时未替换DoubleArrayTrie导致分词不符合预期的问题 by @wxy929629 in #1835
- fix:修复CWSEvaluator比较切分语句时的计算错误 by @webSue in #1853
- 数据包兼容data-for-1.7.5.zip
md5=1d9e1be4378b2dbc635858d9c3517aaa
- Portable版同步升级到v1.8.5
<dependency> <groupId>com.hankcs</groupId> <artifactId>hanlp</artifactId> <version>portable-1.8.5</version> </dependency>
更新说明:https://github.com/hankcs/HanLP/releases/tag/v1.8.5