ES上使用IK中文分词器 es-ik

MIT
Java
跨平台
2015-09-05
翟志军

IK中文分词器在Elasticsearch上的使用。原生IK中文分词是从文件系统中读取词典,es-ik本身可扩展成从不同的源读取词典。目前提供从sqlite3数据库中读取。es-ik-plugin-sqlite3使用方法:

1. 在elasticsearch.yml中设置你的sqlite3词典的位置:

ik_analysis_db_path: /opt/ik/dictionary.db

我提供了默认的词典:https://github.com/zacker330/es-ik-sqlite3-dictionary

2. 安装(目前是1.0.1版本)

./bin/plugin -i ik-analysis -u https://github.com/zacker330/es-ik-plugin-sqlite3-release/raw/master/es-ik-sqlite3-1.0.1.zip

3. 现在可以测试了:

    1. 创建index

curl -X PUT -H "Cache-Control: no-cache" -d '{
    "settings":{
        "index":{
            "number_of_shards":1,
            "number_of_replicas": 1
        }
    }
}' 'http://localhost:9200/songs/'

      2. 创建map:

curl -X PUT -H "Cache-Control: no-cache" -d '{
        "song": {
            "_source": {"enabled": true},
            "_all": {
                "indexAnalyzer": "ik_analysis",
                "searchAnalyzer": "ik_analysis",
                "term_vector": "no",
                "store": "true"
            },
            "properties":{
                "title":{
                    "type": "string",
                    "store": "yes",
                    "indexAnalyzer": "ik_analysis",
                    "searchAnalyzer": "ik_analysis",
                    "include_in_all": "true"
                }
            }

        }
}
    ' 'http://localhost:9200/songs/_mapping/song'

       3.

curl -X POST  -d '林夕为我们作词' 'http://localhost:9200/songs/_analyze?analyzer=ik_analysis'

response:
{"tokens":[{"token":"林夕","start_offset":0,"end_offset":2,"type":"CN_WORD","position":1},{"token":"作词","start_offset":5,"end_offset":7,"type":"CN_WORD","position":2}]}

的码云指数为
超过 的项目
加载中

评论(6)

翟志军
翟志军 软件作者
可扩展性不错。~ 可以扩展到其它类型
wuyiw
wuyiw
___白
___白
赞一个
枯叶_听海
枯叶_听海
居然是志军写的
laudukang
laudukang
推荐
OSC闲人
OSC闲人
不错的开源软件

暂无资讯

暂无问答

elasticsearch 集群在线水平扩容收缩

服务器信息 elasticsearch版本 1.6.0 jdk版本 1.7.0_80 ``` 10.100.0.29 es1 10.100.0.44 es2 10.100.0.45 es3 10.100.0.46 es4 10.100.0.47 es5 ``` ## 在线扩容(3->5) ### 原es集群 es1,...

2016/06/04 16:46
916
0
elasticsearch安装配置及中文分词

ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。   我们...

2016/09/13 14:44
22
0
SpringBoot ElasticSearch 全文搜索

一、pom.xml配置 SpringBoot版本1.5.6https://blog.csdn.net/kingice1014/article/details/73166686 <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-st...

2018/06/14 16:34
872
0
elasticsearch初识

注:日常学习记录贴,下面描述的有误解的话请指出,大家一同学习。 elasticsearch作为一个全文搜索器,很多人喜欢拿去和solr对比,因为我之前在工作使用了elasticsearch,一直没有好好的整理...

2018/08/01 10:41
3
0
elasticsearch之ik分词器插件安装

最近学习es,记录下怎么安装ik分词器,方便参考。 ik分词器安装很简单, 进入https://github.com/medcl/elasticsearch-analysis-ik/releases 下载对应es版本的zip包,该包是无需用mvn打包版本...

2018/09/18 09:33
0
0
elasticsearch-analysis-ik-1.10.0中文分词插件安装

版本说明 根据ik官网提示,elasticsearch2.4.0需要使用elasticsearch-analysis-ik-1.10.0版本 前提条件 首先,需要有一个es服务器. 其次,需要一个maven环境(由于ik不再支持install安装,只能通过...

2016/10/09 19:26
80
0
ElasticSearch 使用心得

ES生产环境中遇到的问题和解决方案

2015/12/18 18:48
1K
0
IK分词器安装

转自http://my.oschina.net/xiaohui249/blog/232784?p=1

2014/08/04 12:31
117
0
ElasticSearch安装ik分词插件

在搜索领域,中文分词一直都是难题。经过很多大牛的不懈努力,还是出现了一些很不错的中文分词器,比如本文提到的IK。本文主要基于ES,安装ik分词插件。

2014/05/03 21:46
35.7K
5

没有更多内容

加载失败,请刷新页面

返回顶部
顶部