写了个小爬虫,想爬赶集网,访问太快要输入验证码,怎么破

黑香蕉 发布于 2016/06/28 01:53
阅读 2K+
收藏 2

<无详细内容>

加载中
1
Vicent-for-Vendtta
Vicent-for-Vendtta

1.高匿ip代理池 

2.切换ua

3.爬慢点

4.如果是简单的数字或者英文呢的验证码 识别他 


0
yak
yak

https://github.com/tablecell/mirrorsite/blob/master/app.py

不要连续爬,

time.sleep(config['refresh_fruiqence'])



设置sleep 间隔时间

0
zabcd117
zabcd117

1、匿名代理

2、集成国内的打码平台,相当便宜,一般的验证码,一个1分钱,成功率90%,3秒内返回数据,都是restful接口。

0
fullerhua
fullerhua
比较有效的方式是连打码平台
0
s
sosozzzx

试试神箭手云爬虫平台的赶集个人二手房房源信息爬虫支持云端自动采集,实时监控更新~

爬虫链接:http://www.shenjianshou.cn/index.php?r=market/configDetail&pid=210

0
斐斐4i
斐斐4i

推荐验证码识别,可以接入这个平台,有更实惠的价格和更优质的服务,现在7月份还有接近免费的推广活动呢

http://www.fatea.net/ocr_cap.html?oid=184

返回顶部
顶部