Jcseg-1.9.6 发布,词性补全+lucene/solr/elasticsearch 最新版本支持

狮子的魂
 狮子的魂
发布于 2015年06月09日
收藏 48

Jcseg[dʒɛ'ke'sɛ]是使用Java开发的一个轻量级中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene-5.1.0(发布时我发现5.2.0又发布了 ),solr-5.1.0,elasticsearch-1.5.2的分词接口.

Jcseg-1.9.6:

1. mmseg过滤器的lazyInitRace bug修复。

2. 同义词&拼音的高亮显示bug修复。

3. detect模式增加位置返回和部分bug修复。

4. 词库词性补全(绝大部分常用词条的词性已经全部补全)。

5. 增加对最新版本的lucene(5.1.0), solr(5.1.0), elasticsearch(1.5.2)的支持。

6. 词库autoload多目录支持bug修复。

7. 合并jcseg-solr到jcseg-analyzer模块了,研究lucene analysis接口变化情况时发现其实他们应该合在一起。

git项目中直接托管了最新的jar包,直接到git下载即可。

上一个版本发布是去年8月份,有很多网友邮件问道是不是不再更新了,只是现在空余时间比较少,进度慢了。

感谢大家的支持与关注! 

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:Jcseg-1.9.6 发布,词性补全+lucene/solr/elasticsearch 最新版本支持
加载中

最新评论(9

红鼠、
红鼠、

引用来自“海风心情”的评论

请问像我们电子病历的病程记录很多医学专业词汇,怎么分词呢?可以自主学习或者支持字典库吗?

引用来自“狮子的魂”的评论

支持完全自定义词库!
太好了,可以加你扣扣吗?
狮子的魂
狮子的魂

引用来自“海风心情”的评论

请问像我们电子病历的病程记录很多医学专业词汇,怎么分词呢?可以自主学习或者支持字典库吗?
支持完全自定义词库!
红鼠、
红鼠、
请问像我们电子病历的病程记录很多医学专业词汇,怎么分词呢?可以自主学习或者支持字典库吗?
凯撒大弚
凯撒大弚
要跟上lucene的脚步啊
7
7759
艰苦
小安安
小安安
不支持3.6的lucene吗?
Koma
Koma
顶!
ldl123292
ldl123292
返回顶部
顶部