如何设计爬虫代理机制?

happylifelx 发布于 2014/09/27 12:02
阅读 2K+
收藏 1

9月21日,源创会西安,聊聊大模型技术与产业应用

目标是抓取几十个网站,但其中只有少数网站的某些域名下会有反爬机制,试着用代理访问,相比不用代理访问速度明显较慢,而且IP质量有的很不好,觉得要是本来不用代理的也加代理的话也没必要,但是想让自己的爬虫不被封,还尽可能的有效率,有什么好方法吗,大家都用什么机制?IP质量难以保证怎么弄啊
加载中
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部