横向搜索

并发 发布于 2014/06/21 14:39
阅读 312
收藏 0
        时间对任何生物来说都是重要的,过去了的时间是不能找回来的。光速也需要时间,所以幻想时光会倒流那是童话故事。
        常规的搜索我们都是以单个网站或者单个页面进行搜索,这已经是有搜索引擎出现,我们都是这样做的,已经没人怀疑这种搜索的效率了。
        我们有时想在多个网站搜索同样的事物,如购物,想看一下哪家网站价格、服务、销量等等怎么样,常规我们是每个站每个站输入搜索串进行搜索,之后在各自的页面上查找感兴趣的东西,找到后,有人会用笔把它记录下来然后翻到另外的页面上找,大家就是这样找了十几年,几十年。
        若我们在3个站上搜索,按一个页面是1倍时间的话,3个就是3倍,也就是说,若每天都这么做的话,同样的功夫若一天能做完的东西,那就要2天,3天,4天甚至更多的时间了。说成吓人一点,若人能活100岁,每天如上工作,那只能等于活了50年,30年,20年了。
        能否把重复的工作免去呢?如上面的工作,只输入一次搜索串,就能搜索多个站点或者多个页面呢?在此我把这种搜索称之为“横向搜索”。 横向搜索就是在多个不 同的搜索页面中进行搜索,搜索页面可以是不同的网站页面也可以相同,如同时在《淘宝》《天猫》《京东》《国美》等上搜索。
        我想下一种新型网页浏览器,一定是这个方向的,且不单能“横向搜索”还能“纵向搜索”。那时,搜索网站的搜索串也就要标准化了,所有的网站若要搜索都要按这种标准进行了。
加载中
0
自由之信
自由之信

目前的搜索引擎,比如按照google和yahoo的说法,其实他们都是多个crawler在并发的在N多个页面上搜索并存储数据,后面用类似Map-Reduce的技术来分类数据,这个是搜索的基础,然后,剩下的数据是横向的展示,还是纵向的展示,只是一个在数据上的排序和检索的问题。如果是实时的搜索,可能性很小,数量很大,计算需要时间。

0
Mr_Tank_
Mr_Tank_

谷歌这些搜索引擎可以叫做通用搜索。没有记错的话,你说的这个需求叫做垂直搜索。

如同时在《淘宝》《天猫》《京东》《国美》等上搜索

这个比如:网易旗下的比价网“慧慧网”。。就是做这个的了

0
Mr_Tank_
Mr_Tank_
还有就是有些电商是禁止爬虫采集数据的,比如百度和淘宝。。
0
并发
并发
感谢大家赐教!本人文化水平低,词不达意。本文是以网页浏览角度描述的,不考虑蛛蛛爬虫什么的。搜索出来的页面貌似这样,来个图吧。(说明一下:图是火狐同时用国美在线,天猫,京东,淘宝搜索iphone5的样子)
Mr_Tank_
Mr_Tank_
==。
返回顶部
顶部