Lucene&paoding全文检索

开源中国首席脑科主任 发布于 2013/10/13 23:31
阅读 771
收藏 0

我想问一个关于lucene的问题:

比如说我通过padding(庖丁分词器)将一个词语  比如:昆仑山

问题1:

我在基础词库中加入了  "仑山"  
在lucene建立索引的时候,会创建"仑山" 这个词的索引,在查询昆仑山的时候这个词可以被查询到,但是如果我直接查询"仑" 却查不个到”昆仑山"这个词,paoding的jar包有它基本的词库,但是有没有一种方式:

比如说:我查数据库中一张产品表的数据,拿出记录中产品名字,分词,在lucene创建索引的时候,有最基本的 单个词的索引  在索引里面至少有 "昆"  "仑"   "山"单个字的索引,而我在词语增加的时候每次都在基础词库中加入单个字的索引


    求大神指导,小弟正在研究lucene


加载中
0
夜雨声烦
夜雨声烦

例如 用IK分词器,smart=true/false,基本可以搞定你所说的一切情况。如果还需要单字,可以再同时使用startAnalyzer;

0
fr_kaka
fr_kaka
lucene的分词是将要分析的内容转化成一个个Term(token),如果你要一个字一个字都变成一项的话,直接用StandardAnalyzer就好了
返回顶部
顶部