PHP采集能不能不被识别出来!

hahamao 发布于 2014/11/28 14:04
阅读 235
收藏 0
PHP

有的站我看有简单的防采集,模拟下来源就可以了,但是有的站模拟来源模拟ip都没用!

我想知道这样的站还有没有办法采集到!

加载中
0
DcV
DcV
只要分析的够透彻,都会采集到的。
0
idea_biu
idea_biu
沒有採集不到的網站,只要你對外開放
0
王道中强流
王道中强流

只要人可以看到的,就可以被程序采集到。

我所知道的有以下几种:

检查来路,检查User-Agent,检查COOKIE,但都很容易伪造。

Google的做法是:限单个IP 时间段内的 刷新次数,超出限制 会要求输入验证码。

王道中强流
王道中强流
回复 @hahamao : 那你程序 就加几个错误判断,出错了 暂停一会儿。
h
hahamao
现在也不是完全采集不到,就是间歇性的,我怀疑是他做了防采集
0
钛元素
钛元素
来自于一个ip的访问速度超过人类极限,就有可能被识别。当然大多数网站做不到
0
帖子列表
帖子列表
生N个娃, 关起来, 做人工测试
返回顶部
顶部