Scrapy爬虫xpath和解析

隔壁的流氓王欧巴 发布于 2016/06/04 13:56
阅读 1K+
收藏 0





求大神帮忙改改。。。而且我想知道这里面的xpath和chrome的xpath是什么关系,直接复制chrome的xpath抓不到数据。。。现在加text()获取的内容都是错的,不加text()获取的内容是对的,但是会带着html代码,求解决。

加载中
0
好铁
好铁
进入scrapy shell慢慢调试
好铁
好铁
回复 @隔壁的流氓王欧巴 : http://www.pycoding.com/2015/05/19/xpath-introduce.html
隔壁的流氓王欧巴
隔壁的流氓王欧巴
真心调了。。。真心不会
0
fkkeee
fkkeee

不需要用你代码里的 for;

直接用 response.xpath('//*[@id="tab1_div_0"]/ul/li/em/text()').extract()获取所得数据,再合并不同的行,比如用u'\xa0'分开合并。

fkkeee
fkkeee
回复 @隔壁的流氓王欧巴 : 随自己,你要保存什么格式的数据就怎么拆、怎么合。具体方法就不用说了吧。
隔壁的流氓王欧巴
隔壁的流氓王欧巴
join合并么?
返回顶部
顶部