Jcseg-1.9.6 发布,词性补全+lucene/solr/elasticsearch 最新版本支持 - 开源中国社区
Float_left Icon_close
Jcseg-1.9.6 发布,词性补全+lucene/solr/elasticsearch 最新版本支持
狮子的魂 2015年06月09日

Jcseg-1.9.6 发布,词性补全+lucene/solr/elasticsearch 最新版本支持

狮子的魂 狮子的魂 发布于2015年06月09日 收藏 48 评论 9

Jcseg[dʒɛ'ke'sɛ]是使用Java开发的一个轻量级中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene-5.1.0(发布时我发现5.2.0又发布了 ),solr-5.1.0,elasticsearch-1.5.2的分词接口.

Jcseg-1.9.6:

1. mmseg过滤器的lazyInitRace bug修复。

2. 同义词&拼音的高亮显示bug修复。

3. detect模式增加位置返回和部分bug修复。

4. 词库词性补全(绝大部分常用词条的词性已经全部补全)。

5. 增加对最新版本的lucene(5.1.0), solr(5.1.0), elasticsearch(1.5.2)的支持。

6. 词库autoload多目录支持bug修复。

7. 合并jcseg-solr到jcseg-analyzer模块了,研究lucene analysis接口变化情况时发现其实他们应该合在一起。

git项目中直接托管了最新的jar包,直接到git下载即可。

上一个版本发布是去年8月份,有很多网友邮件问道是不是不再更新了,只是现在空余时间比较少,进度慢了。

感谢大家的支持与关注! 

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:Jcseg-1.9.6 发布,词性补全+lucene/solr/elasticsearch 最新版本支持
分享
评论(9)
最新评论
0
顶,希望继续开发二元分词
0

引用来自“海风心情”的评论

请问像我们电子病历的病程记录很多医学专业词汇,怎么分词呢?可以自主学习或者支持字典库吗?

引用来自“狮子的魂”的评论

支持完全自定义词库!
太好了,可以加你扣扣吗?
0

引用来自“海风心情”的评论

请问像我们电子病历的病程记录很多医学专业词汇,怎么分词呢?可以自主学习或者支持字典库吗?
支持完全自定义词库!
0
请问像我们电子病历的病程记录很多医学专业词汇,怎么分词呢?可以自主学习或者支持字典库吗?
0
要跟上lucene的脚步啊
0
艰苦
0
不支持3.6的lucene吗?
0
顶!
0
顶部