IKAnalyzer 正在参加 2021 年度 OSC 中国开源项目评选,请投票支持!
IKAnalyzer 在 2021 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
2021 年度 OSC 中国开源项目评选 正在火热进行中,快来投票支持你喜欢的开源项目!
2021 年度 OSC 中国开源项目评选 >>> 中场回顾
IKAnalyzer 获得 2021 年度 OSC 中国开源项目评选「最佳人气项目」 !
授权协议 Apache
开发语言 Java
操作系统 跨平台
软件类型 开源软件
所属分类 程序开发中文分词库
开源组织
地区 国产
投 递 者 林良益
适用人群 未知
收录时间 2008-12-03

软件简介

IK Analyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。从3.0版本开始,IK发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。在2012版本中,IK实现了简单的分词歧义排除算法,标志着IK分词器从单纯的词典分词向模拟语义分词衍化。

IK Analyzer 2012特性:

  1. 采用了特有的“正向迭代最细粒度切分算法“,支持细粒度和智能分词两种切分模式;

  2. 在系统环境:Core2 i7 3.4G双核,4G内存,window 7 64位, Sun JDK 1.6_29 64位 普通pc环境测试,IK2012具有160万字/秒(3000KB/S)的高速处理能力。

  3. 2012版本的智能分词模式支持简单的分词排歧义处理和数量词合并输出。

  4. 采用了多子处理器分析模式,支持:英文字母、数字、中文词汇等分词处理,兼容韩文、日文字符

  5. 优化的词典存储,更小的内存占用。支持用户词典扩展定义。特别的,在2012版本,词典支持中文,英文,数字混合词语。

IKAnalyzer 同时还有一个非官方的 .NET 版本 —— IKAnalyzer.NET

展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论

点击加入讨论🔥(17)
发表了资讯
2015/01/22 00:00

IKAnalyzer 中文分词库源码已迁移到 Git@OSC

IKAnalyzer 是一个非常著名和老牌的 Java 中文分词库,目前 OSChina 网站也是使用 IK 分词器。IKAnalyzer 的代码一直放在 Google Code 的,你知道的,Google Code 系统做得比较“糟糕”,经常无法访问。 为了方便开发者快速方便获取代码,IKAnalyzer 的作者 @林良益 已经将项目源码托管到 Git@OSC 平台,项目地址是: http://git.oschina.net/wltea/IK-Analyzer-2012FF...

34
58
发表了资讯
2012/10/23 00:00

IK Analyzer 2012 FF for Lucene 4.0 发布

最近一段时间正式公司事务最忙碌的时候,Lucene4.0和Solr4.0发布后,便收到了广大网友的大量邮件要求更新版本,这让我既开心又感到鸭梨大啊~~ 花了3天时间,了解了Lucene4.0和solr 4.0与分词相关部分的源码。果然,又是一次不兼容的修订啊~~ 时间紧迫的推出了IK Analyzer 2012 FF版本 (你问啥是FF,其实就是For 4.0),在API和功能上保持不变,只是让其支持了Lucene4.0和Solr4.0,让这部分的用户能用起来。 如果你还是Lucene3...

16
13
发表了资讯
2012/03/15 00:00

IK Analyzer 2012 发布,中文分词库

IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。从3.0版本开 始,IK发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。在2012版本中,IK实现了简单的分词 歧义排除算法,标志着IK分词器从单纯的词典分词向模拟语义分...

11
37
发表了资讯
2010/09/13 00:00

IK Analyzer 3.2.5 稳定版发布

IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出 了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为 面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。 IK Analyzer 3.2.5 版本在 3.2.3 版本基础上修订了如下内容: 1.修订了分词器内部的数组越...

2
4
发表了资讯
2010/05/26 00:00

IK Analyzer 3.2.3 稳定版 for Lucene 3.0 发布

IK Analyzer 3.2.3版本修订 在3.2.0版本基础上,更新如下: 1.优化词典匹配算法,将IK分词器速度提高至80万字/秒 2.添加对韩文、日文的支持,采用单字切分 3.增加IKQueryParser的 setMaxWordLength 方法,使其支持最大词长切分 下载地址 IKAnalyzer3.2.0稳定版发布包 IKAnalyzer3.2.0稳定版源代码

1
2
发表了资讯
2009/12/10 00:00

IKAnalyzer 3.2.0 发布,兼容 Lucene 3.0

由于Lucene3.0 API的全面升级,且不再与Lucene2.X兼容, IK Analyzer为此推出了3.2.0版本。该版本仅支持Lucene2.9 / 3.0和solr1.4的接口实现。 IK Analyzer 3.2.0版本修订 1.支持Lucene3.0 Analyzer实现 2.移除solr1.3接口,修改solr1.4接口 3.默认开放停止词功能,发布IK自带的ext_stopword.dic停止词典 4.优化了IKQueryParser的性能 下载地址:http://ik-analyzer.googlecode.com/files/IKAnalyzer3.2.0Stable_bin.rar IKAna...

0
0
发表了资讯
2009/08/31 00:00

IKAnalyzer 3.1.1 稳定版发布

IK Analyzer 3.1.1Stable版本是基于3.1.1GA2的变更: 1.修订了IK Analyzer 与 solr项目集成时,出现指针越界的不兼容的问题。 感谢北京何健网友的测试帮助。 下载 :IKAnalyzer3.1.1稳定版完整包.rar 更多详细请参看《IKAnalyzer中文分词器V3.1.1使用手册.pdf》 项目地址:http://code.google.com/p/ik-analyzer/ 请使用SVN下载源码。...

1
0
发表了资讯
2009/07/27 00:00

中文分词器 IK Analyzer 3.0 发布

IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始, IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IK Analyzer 3.0则发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。 1.1 IK Analyzer 3.0结构设计 1.2 IK Analyzer 3.0特性 采用了特有的“正向迭代最细粒度...

0
14
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了博客
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
发表了问答
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
暂无内容
17 评论
702 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部