webmagic java爬虫获取网页中的超链接时,超链接的地址是不完整的,怎么能获得超链接的完整地址?

Nicll 发布于 2018/01/11 10:38
阅读 1K+
收藏 0

如图所示,下获取初始页面的这些超链接中的内容,获取的链接都是  ?p=1  这种,

隐藏的地址怎么加上?

加载中
0
litice
litice

在其前面用当前url进行拼接就行了~

Nicll
Nicll
是想作为网页添加到爬取网页中的,不知道怎么拼
0
j
jiudu815

使用当前抓取的网页的url作为前缀

Nicll
Nicll
我想在数字后面拼.html,这个要怎么加上?
返回顶部
顶部