爬虫是什么原理?怎么能遍历一个网站所有链接?

心有千千问 发布于 2015/06/16 08:36
阅读 2K+
收藏 0
加载中
2
lieefu
lieefu
比如爬一个网站,先获得首页内容,然后解析出首页内的所有链接,然后把所有链接的内容获得,再解析页内的链接,以此类推,这是最简单的爬虫原理。你明白了么?
0
GavinHsueh
GavinHsueh
换叫蜘蛛,你应该理解了吧。。。。
0
s
sdasfd34
换成遍历文件夹,该理解了吧
0
不日小鸡
文本遍历,应该懂了吧
0
卖爷爷的老红薯
卖爷爷的老红薯
其实就是函数和类。。。
0
yuluo
yuluo

页面html文档读取,解析读取的html节点

返回顶部
顶部