Google 爬虫又学了一招:理解 JavaScript 代码 - 开源中国社区
Float_left Icon_close
Google 爬虫又学了一招:理解 JavaScript 代码
红薯 2010年06月27日

Google 爬虫又学了一招:理解 JavaScript 代码

红薯 红薯 发布于2010年06月27日 收藏 2 评论 8

Google数以亿计的爬虫们每天都在以光速索引着互联网上的信息,以便我们能通过Google搜索到最新的内容。最近Google的发言人告诉福布斯说他们的爬虫现在可以跟JavaScript做深入互动了,它们甚至可以理解JavaScript 代码,这将使Google可以索引到更丰富的内容。

让一个程序理解JavaScript并不是一件简单的事,没有哪种算法可以应用到任何程序上,在任何点,告诉你这个程序是否可以继续无限循环下去, 然而如果Google的爬虫可以处理JavaScript,他们就必须解决这种困难。

Google爬虫变得越来越快越来越聪明还要感谢新的Caffeine系 统,正是这个新系统使得Google爬虫具备了理解甚至处理代码的能力,以更好的解析富媒体。

Via Mashable

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:Google 爬虫又学了一招:理解 JavaScript 代码
分享
评论(8)
最新评论
0
嗯 我也是研究爬虫的,我也想理解javascript。。。
0
那个,漂过。
0
有必要理解能不能继续循环么,只要知道有哪些分支不就够了。
0
应该也没吹得那么复杂
0
开源不?很希望能开源。
0

引用来自“张林”的评论

估计是某种类自动机有着某种神经子系统的代码
谷歌的search做的越来越匪夷所思,越来越高明了,也同时拉大了各搜索引擎的距离。
龟缩goso网洗洗睡吧

支持楼上的观点!
0
估计是某种类自动机有着某种神经子系统的代码
谷歌的search做的越来越匪夷所思,越来越高明了,也同时拉大了各搜索引擎的距离。
龟缩goso网洗洗睡吧
0
所谓创新,正是这种简单中透出的伟大
顶部