Lucene取消分词

主席 发布于 2012/02/29 15:19
阅读 811
收藏 0

现在需要做这样一个功能

1.创建索引  Lucene(已完成) filename,fileContent,fileKMark

2.查询索引  filename,fileContent,fileKMark 中的任何一个只要包含 est1 就查出来

Lucene有分词的功能,我现在想取消分词,查询结果

加载中
0
红薯
红薯

自己实现个 Analyzer 类罗

不过 Lucene 就是基于分词的,你不用分词那还用 Lucene 干嘛呢?

羅立安的眼光
羅立安的眼光
难道是全英文的
0
有个二逼领导的程序员
有个二逼领导的程序员

全英文也有分词呀,按空格切的

0
黄龍
黄龍

取消分词没有听过,但是lucene是可以自己选择分词器(Analyzer )的~你应该自己查找怎么样的分词器适合你~

0
主席
主席

要做一个搜索 文档内容的功能 如果分词了 就不准确了

0
黄龍
黄龍

你是打算整篇文章完整存起来作为索引? 那你还使用lucene干什么?

黄龍
黄龍
@主席 : 首先,创建索引必须要一个分词器的. 创建索引以及搜索时使用同一的分词器! 一般不会出现匹配错误的! 但是使用中文分词器会出现很多的不确定因素!!!! 如果有需要你也可以自己实现一个分词器,或者上网找符合你需求的分词器!
主席
主席
我给.doc .pdf 文件创建索引,内容 标题 都要创建索引 输入搜索词 去内容和标题上匹配(不要把输入的信息分词) 查出结果就可以了 我想使用一个空的分词器 应该就能解决这个问题
0
修真0
修真0
你可以加一个segment域,把内容都加进去,查得时候直接只查这个域就可以了
返回顶部
顶部