webmagic表格爬行问题

jackyrong 发布于 2017/04/10 23:27
阅读 773
收藏 0

有一个如下的TABEL,要获得每一行TR的TD中的内容:
<div id="table_Head">
<table width="100%>

<thead> ....</thead>
<tbody id="tenderProjectTab">
<tr style=“font-size:13px"><td>abc<td></tr>

......

</tbody>

</table>

</div>

如果用XPATH的话,我这样的话,只能取到<tbody id="tenderProjectTab"></tbody>
,但我期望拿到的是<tbody>中所有的<TR>标签的集合呀,然后再循环用JSOUP去获得TR中的每个TD内容呢。

          page.putField("content", page.getHtml().xpath("//div[@class='table_Head']/table[@width='100%']/tbody[@id='tenderProjectTab']").all());

要如何处理呢?

加载中
0
爱星雾月
爱星雾月
如果是很复杂的问题就不懂,如果是简单的用jquery?
0
j
jackyrong

引用来自“戴帽子的狗”的评论

xpath  /tbody[id=tenderProjectTab]//tr  拿不到么?

不行

0
名字真不好起
名字真不好起

1. xpath("//tbody[@id=tenderProjectTab]/tr").nodes()

2. page.getHtml().$("#tenderProjectTab>tr").nodes()

0
j
jackyrong

引用来自“名字真不好起”的评论

1. xpath("//tbody[@id=tenderProjectTab]/tr").nodes()

2. page.getHtml().$("#tenderProjectTab>tr").nodes()

不行,只取到<tbody id="></tbody>

返回顶部
顶部