Lucene 索引上G后 搜索性能很差

melody_ 发布于 2013/05/31 09:58
阅读 2K+
收藏 0

当我的索引8千万个文档后  索引大小11.5G 

搜索性能明显变差 用indexSearch.search(query,1000) 

一个不复杂的query要20秒以上

请各位大大有什么思路优化在1秒内吗

加载中
1
南湖船老大
南湖船老大

引用来自“宏哥”的答案

java的东西, 去谈性能是很扯淡的事情。

尽说无用的废话。要么给出技术解决方案,要么呵呵.

要是我去黑Java的话,我会先把Java学的八九不离十,谁要是发个Java的帖子,我就去找茬,指出代码错误和不规范,给出正确代码。谁要是不服,我也不怕他和我讨论技术细节。

有时候我也会去黑你最喜爱和推崇的PHP,指出哪些是PHP烂代码,并且说出那些PHP代码的缺陷,然后给出比那垃圾代码更好的写法。前提是建立在我已经把PHP学的八九不离十的基础上。

黑Java,你没有博客园的老赵专业,就是老赵黑Java也得准备半天,写上一堆代码,画图,做PPT。 做为专业黑,你明显没有老赵专业啊,比我都差远了。

小生不才,为码农两年半,自认为Java和PHP技术不错,恰好你经常提及的语言也是这两块,你扬PHP而黑Java,正好可以和我互黑,欢迎一起来。至于你黑mysql,扬postgres,这个Pg我倒不咋懂,先记下,日后再来找你互黑。

南湖船老大
南湖船老大
回复 @熊猫与猫无关 : 他对C++一窍不通,没有黑C++的资格
熊猫与猫无关
熊猫与猫无关
关于宏哥话题似乎忘记了C++和OO,行业与职位的选择等等
0
曾杰
曾杰

不会吧?你排序了?


melody_
melody_
命中的条数很多 totalHits有7千万
0
宏哥
宏哥
java的东西, 去谈性能是很扯淡的事情。
0
震秦
震秦

引用来自“宏哥”的答案

java的东西, 去谈性能是很扯淡的事情。

不要说这个, 太偏激了不好.

Lucene就是很快, 没得说. 

你搜索能返回数量过大, 相当于全表扫描. 还是建议你用更多字段约束使结果集变小.

震秦
震秦
回复 @DShaco : 那你被绑架了, 还要求绑匪免费放人,能行吗?
melody_
melody_
减少范围 是很难做到,因为每秒接受数据. 如果能取得最近的1000条,性能可以快很多 可是lucene的搜索返回是一个精确的值.
0
震秦
震秦
再一个, 你的数据量已经都偏大了. 应该考虑分布式搜索的时候了. 
melody_
melody_
因为一些原因,暂时不考虑分布式.
0
jim.z
jim.z
totalHits有7千万,命中数这么多能不慢吗
melody_
melody_
就算1秒索引2000条 一天索引10小时 就有7千200万 查询7天内的记录 很有可能命中6千万
0
挖粪涂墙
挖粪涂墙
别信傻X的话,自己看看瓶颈在哪里,可以优化的
0
pyruby
pyruby

引用来自“宏哥”的答案

java的东西, 去谈性能是很扯淡的事情。
这话要引起口水了。。
regulusun
regulusun
对这话根本无须评论 一笑而过就行了
0
zhongguo
zhongguo
看过 @宏哥 的以往回复,我心安了
返回顶部
顶部