1
回答
xpath匹配文本,匹配不到位
终于搞明白,存储TCO原来是这样算的>>>   

想要匹配出图片中箭头所指的文本内容,我用起始位置div/span[text()="Auditing Details"]标记,但是匹配出来的好乱

 

我写的代码如下:

import scrapy

class fhdspider(scrapy.Spider):
    name = "fhd"
    start_urls = ['file:///C:/Users/Administrator/Desktop/userInfo.html']

   
    def parse(self,response):
        sel = scrapy.selector.Selector(response)
        data = []
        data = sel.xpath('//td[text()="Web Reporter"]/following::*/text()')
        print(data)

谁帮我看一下,不胜感激!

<无标签>
举报

我的经验是尽量不要用//去匹配,这样匹配到你不想要的节点的概率太高了。chrome/firefox在开发者工具可以直接复制出来xpath,不用你一个个去看了。不过特别注意chrome复制出来的xpath在table处可能会多一个<tbody>标签,这个是chrome页面渲染的时候加上去的,页面源码可能没有。

 

最后就是,你这个xpath很明显不对,你那个text是span的,而不是td的

--- 共有 1 条评论 ---
金樽清酒斗十千ok,thank you 7个月前 回复
顶部