5
回答
java开源的爬虫推荐一个
滴滴云服务器,限时包月0.9元,为开发者而生>>>   

各位大大,我想找个爬虫,网络爬取一些信息,主要是爬取一些金融类的网站。大家给推荐一个。



举报
imjavacoder
发帖于3年前 5回/792阅
推荐使用神箭手云爬虫( http://www.shenjianshou.cn ),完全在云上编写和执行爬虫,不需要配置任何开发环境,快速开发快速实现。 

简单几行 javascript 就可以实现复杂的爬虫,同时提供很多功能函数:反反爬虫、 js 渲染、数据发布、图表分析、反防盗链等,这些在开发爬虫过程中经常会遇到的问题都由神箭手帮你解决。 

我建议使用前嗅的ForeSpider数据采集软件,这款软件操作可视化,使用简易,支持登录、Cookie、Post、https、验证码、JS、Ajax、关键词搜索等技术,一般网页上的公开数据基本都可以采到。如果网站比较复杂,软件里有自带的爬虫脚本语言,通过写脚本,就能完全采集数据了。
我之前是采集过京东的商品评论,不仅采集了数据而且能够在软件里进行数据挖掘和分类、统计、数据分析。
ForeSpider内部集成了数据挖掘的功能,可以快速进行聚类分类、统计分析等,采集结果入库后就可以形成分析报表。
软件还自带免费的数据库,数据采集直接存入数据库,也可以导出成excel文件。
所以你可以去下载免费版先试试看,免费版不限制采集功能,也不限制时间。并且有详细的操作手册可以学习。如果自己不想学习,可以让前嗅进行配置。
而且还有客服可以教你怎样用,有问题出错了客服会远程操作,非常好的服务态度。
我也是一直使用这款软件,非常强大,推荐给你希望对你有帮助。

顶部