一个新手对于全文索引的一些问题。

一岁穿耐克 发布于 2014/05/24 23:15
阅读 429
收藏 0

我目前有个项目,是自己做着玩儿的小项目,数据库有10W的数据量,跑在百度云上。

其实我是想解决搜索速度和搜索容错的问题。

通过几天的学习呢,索引,分词,搜索有了大概的了解了。

【建立索引】
学习Lucene的时候,是对文件做索引,项目中目前数据是存放在MYSQL数据库中,那么建立索引就是通过读数据库,一条一条的保存索引?

【关于搜索速度】

我的数据条数比较多,但是每一条的数据量其实并不大,所以我感觉我的内容都是可以直接保存在索引中的,

那么好像就是做搜索业务的时候就用不到数据库了?还有就是Lucene搜索快还是数据库搜索快呢?

【关于搜索容错】

其实这是主要使用Lucene的原因,就是想分词,比如说数据库保存的"优の良曲南搞小孩",用户可能输入的是"南搞小孩","优の良曲 南搞小孩",这样子使用中文分词+QueryParser的方式能够实现匹配。我这样子做应该是没有问题的吧?

不知道我的想法和实现方式是不是正确的?

加载中
0
TANWEIJIE
TANWEIJIE

如果是直接把新的数据直接将索引的话不用数据库了。数据量小的时候应该速度上体验不到差别吧?最后一个的话,可以搜出数据就没问题啦。

一岁穿耐克
一岁穿耐克
我也是这么想的,MYSQL最多算做个备份,以后增加新数据直接添加索引里面,都不需要数据库了,刚把Lucene基本操作摸清楚了,明天开始尝试项目用Lucene实现。。。O(∩_∩)O~~
0
铭asniler
建议直接尝试solr,数据量大了以后,查询,插入记录的速度跟mysql不是一个量级的
返回顶部
顶部