配置出错,xpath 抓取为空

王智力 发布于 2014/11/05 14:32
阅读 562
收藏 0

@自风 你好,想跟你请教个问题:对于那种有二级域名或者有防爬和不在同一主机的怎么爬去新闻比如

http://roll.finance.sina.com.cn/finance/gncj/dfjj/index.shtml(防爬取)

http://roll.finance.sina.com.cn/finance/gncj/bwdt/index.shtml(不在同一个主机)

求指导,谢谢

加载中
0
自风
自风
二级域名是需要在xml里面配置 <validHosts><validHost url="" /></validHosts>的
返回顶部
顶部