IKAnalyzer

关注
IK Analyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应...
加载中
27
回答
【开源访谈】IKAnalyzer 作者林良益访谈实录

关于开源访谈 开源访谈是开源中国推出的一系列针对国内优秀开源软件作者的访谈,以文字的方式记录并传播。我们希望开源访谈能全面的展现国内开源软件、开源软件作者...

2012/07/19 14:04
11
回答
IKanalyzer扩展词库动态加载问题
狮子的魂 的回答 2013/09/10 11:46
最佳答案
1. 扩展词库更新后, 需要重建索引才能让新词库对已有的数据生效这个是必须的. 2. 新加入词库后, 重启搜索服务这个可以避免. 不知道IK是否支持词库更新自动加载? 不支持的话, 哥们可以试下jcseg.
1
回答
IKAnalyzer 分词后怎么提取关键词

@石头上的常春藤 你好,想跟你请教个问题: 你好,在网上看到你给别人的回复,说用ansj 及IKAnalyzer 分词提取关键字,现在分词是可以,关键字怎...

2016/07/05 12:12
7
回答
[转]与Lucene 4.10配合的中文分词比较(标准详细的比较)

本文转自: http://www.hansight.com/blog-lucene4.10-with-chinese-segment.html 感谢原作者...

2015/01/18 14:47
1
回答
ikanalyzer和lucene整合关于扩展词典

ik版本是3.2.0stable.jar lucene版本是3.0.2.jar ----------------IKAnalyzer.cfg.xml的配置...

2016/06/11 23:37
3
回答
IKAnalyzer 对英文分词不起作用啊?求指点

IKAnalyzer 对英文分词不起作用啊?求指点 英文怎么分词?

2016/01/13 18:50
2
回答
BosonNLP分词与词性标注引擎新版上线,全面免费开放!

分词在很多网站平台,APP的开发中都是不可或缺的组件,但网上常见的分词项目,对新词与切分歧义的处理差强人意,甚至缺乏一个统一的词语切分标准。在过去的一年时...

2015/08/31 17:55
4
回答
请问分词器的词典里的词存在空格怎么处理?

@杨尚川 你好,想跟你请教个问题: 当想我使用Word想对一些文本进行分词时,我想能分出这样带空格的词,如:Uniform Server 但是,我即使把U...

2015/12/16 07:58
1
回答
BosonNLP分词技术解密

在九月初BosonNLP全面开放了分词和词性标注引擎以后,很多尤其是从事数据处理和自然语言研究的朋友在试用后很好奇,玻森如何能够做到目前的高准确率?希望这...

2015/10/22 15:17
1
回答
IKAnalyzer分词时,stopword.dic文件不放在根目录下可以吗

不想将stopword.dic文件放在根目录下,应该如何在IKAnalyzer.cfg.xml(该文件在根目录下)中配置路径呢

2015/09/17 11:00
2
回答
lucene+MongoDB+IKAnalyzer 做全文搜索

package sample3; import java.io.File; import org.apache.lucene.analysis.Ana...

2012/07/24 11:05
6
回答
IKAnalyzer分词时能保留原文中的所有字符,包括标点符号吗

我查看了一下IK的文档示例,在中文分词后的结果中原字符串中的标点符号都被忽略掉了,有没有办法保留原字符串中的所有字符,只是做分割的动作呢?

2012/04/27 22:11
3
回答
请问有分词器有分粒度大一点的么,java的

目前有个整形项目,通过nutch爬取得到很多中文,通过IK分词效果不是特别理想,如“矫正牙齿”会分成“矫正”和“牙齿”,但是需要这样的词是连起来的,也就是...

2015/08/12 13:52
3
回答
IKAnalyzer没有maven坐标吗,现在要和lucene4.4结合应该用哪个jar文件?

@林良益 你好,想跟你请教个问题:如题

2013/08/13 23:27
4
回答
solr索引时分词,如果更新词库了怎么办??

最近在用solr做一个项目,不断开发不断完善,但同事提出一个问题,以前没考虑过,想了想好像确实有问题。 问题描述: 目前索引的时候分词器采用的是max-w...

2014/06/23 00:12
2
回答
Lucene模糊查询结果不准确

直接描述现实情况: 现有两个产品: A 杭州西溪湿地西区 B 西溪湿地黑根蜡像馆 用“西溪”做模糊查询(WildcardQuery),A搜不出来,B可以搜...

2015/04/22 15:33
8
回答
IKAnalyzer分词器自定义扩展字典设置不起作用

public class TestIKAnalyzer2 { public static void main(String[] args) throws...

2014/03/29 10:19
2
回答
请问分词器的字典在搜索引擎中起什么作用

我用jcseg切分大段中文放入elasticsearch,发现即使字典没有的词一样可以搜索出来。使用match_phrase能完全匹配。 如词“南阳县旅游...

2015/04/02 10:19
65
回答
OSChina底层数据库操作的类(QueryHelper)源码

OSChina 使用的是 dbutils 这个JDBC的封装类库来进行数据库操作。而 QueryHelper 则是在 dbutils 的基础上进行一级简单...

2010/01/31 14:58
2
回答
IKAnalyzer的分词结果有误

@林良益 你好,想跟你请教个问题: 下面这个程序,使用IKanalyzer进行分词,“你好啊”像这样的“X好啊”形式的词都会出现把X删掉,只出现“好啊”,...

2014/11/27 14:52

没有更多内容

加载失败,请刷新页面

返回顶部
顶部