主题模型工具包 Gensim 3.4.0 发布,提速再提速

王练
 王练
发布于 2018年03月03日
收藏 1

Gensim 是用于主题模型、文档索引和海量文本的相似检索的 Python 库,目标受众是自然语言处理(NLP)和信息检索(IR)社区。

Gensim 3.4.0 已发布,主要更新如下:

  • 新增 cython 版 gensim.models.LdaModel ,带来大幅优化,训练速度更快。

  • 新增 Cython 版 MmReader,给 corpus I/O 带来大幅提速。

  • gensim.models.FastText 性能和内存优化

  • 开始使用 Soft Cosine Measure ,这是一个评估文件相似性的新方法,是 WMD 的一个很好的替代方法

此外,该版本还包含大量改进和 bug 修复,详情可查阅发行列表

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:主题模型工具包 Gensim 3.4.0 发布,提速再提速
加载中
返回顶部
顶部