Jcseg 1.9.8 发布,新增检索模式/细粒度切分 - 开源中国社区
Jcseg 1.9.8 发布,新增检索模式/细粒度切分
狮子的魂 2016年06月13日

Jcseg 1.9.8 发布,新增检索模式/细粒度切分

狮子的魂 狮子的魂 发布于2016年06月13日 收藏 66 评论 25

【腾讯云】如何快速搭建微信小程序?>>>  

Jcseg是基于mmseg算法的一个轻量级开源中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了最新版本的lucene, solr, elasticsearch的分词接口。

Jcseg 1.9.8 更新内容:

  1. 增加检索切分模式(SEARCH_MODE),实现细粒度切分,专业为搜索。

  2. 增加DictionaryFactory#createSingletonDictionary,用于创建单例词库。

  3. 将analyzer,elasticsearch接口词库更改为单例创建,节省内存,同时避免了多实例的下词库自动加载无法全局更新的问题。

  4. 提供对lucene,solr 6.0以上版本的支持,elasticsearch 2.3.1以上版本的支持。

  5. 增加JcsegAnalyzer5X如下构造方法方便lucene应用的打包发布:

    JcsegAnalyzer5X(int mode, String proFile)
    JcsegAnalyzer5X(int mode, JcsegTaskConfig config)
    JcsegAnalyzer5X(int mode, JcsegTaskConfig config, ADictionary dic)
  6. 代码格式标准化,例如:4空格代替tab,花括号的换行等。

  7. 词库优化(去除些许无用词,完善部分词条词性定义)。

  8. 修复jcseg-server.properties#jcseg_global_setting名称错误, 更改为:jcseg_global_config。

  9. 修复JcsegServer#http_config设置bug和TokenizerController#pos拼写错误。

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:Jcseg 1.9.8 发布,新增检索模式/细粒度切分
分享
评论(25)
最新评论
0
赞一个
0
不错
0
不错
0
不错
0
0
牛叉叉!!!
0
棒棒的,赞一个!
0
13年从ik转用jcseg,看着作者发的每个版本,期待越做越好!
0
目前最活跃,最好用的分词器,特别喜欢复杂模式和监测模式,新加的搜索模式期待很久了!
0

引用来自“亭舸翁”的评论

@狮子的魂 想问下jcseg是什么开源协议的。可以用在商业产品中吗?

引用来自“狮子的魂”的评论

Apache 2.0协议,不能用于商业通途怎么造福人类(直接拿Jcseg商业用途除外,商业项目中使用啥的都是ok的)!
多谢回复
0

引用来自“亭舸翁”的评论

@狮子的魂 想问下jcseg是什么开源协议的。可以用在商业产品中吗?
Apache 2.0协议,不能用于商业通途怎么造福人类(直接拿Jcseg商业用途除外,商业项目中使用啥的都是ok的)!
0
不错
0
@狮子的魂 想问下jcseg是什么开源协议的。可以用在商业产品中吗?
0
ghjjjj
0
2:first_quarter_moon_with_face::first_quarter_moon_with_face::first_quarter_moon_with_face:2]
0
Fffff2310
0

引用来自“引鸩怼孑”的评论

比起IK 庖丁解牛 有优越之处吗?
http://git.oschina.net/lionsoul/jcseg
0
换个
0
0
顶部