webmagic有解析<table>的方法么,返回 table中所有tr和td 的值??

xuchaoqi 发布于 2014/09/04 19:41
阅读 1K+
收藏 0

@黄亿华 你好,想跟你请教个问题:webmagic有解析<table>的方法么,返回 table中所有tr和td 的值??

xpath怎么获取<td>的文本呢?有的td里还有其他标签 ,能用一个xpaht获取么?

加载中
0
zgw06629
zgw06629

比如如下的表格:

<table itemprop="ingredients">
    <tr>
        <td class="name has-border">
            <a href="/category/4541/">
                鲢鱼
            </a>
        </td>
        <td class="unit has-border">
        </td>
    </tr>
    <tr>
        <td class="name has-border">
            植物油
        </td>
        <td class="unit has-border">
        </td>
    </tr>
</table>

抓取 鲢鱼、植物油

@ExtractBy("//table[@itemprop=\"ingredients\"]/tbody/tr/td[1]/allText()")

注意: 一定要有tbody 即使源码没有。

另外需要用allText,否则鲢鱼抓取不到

0
xuchaoqi
xuchaoqi
3Q,这个搞定了
返回顶部
顶部