spiderman想抓取分页页面列表的信息,而不是进入每个列表后页面的具体信息,怎么配置xml?(我只要列表中的主要信息,没必要进入页面的的具体信息)

LibKing 发布于 2015/06/06 14:23
阅读 363
收藏 0

@自风 你好,想跟你请教个问题:

spiderman想抓取分页页面列表的信息,而不是进入每个列表后页面的具体信息,怎么配置xml?(我只要列表中的主要信息,没必要进入页面的的具体信息)

加载中
0
自风
自风
这个简单,
1. 把分页页面配置成目标页面的规则
2. <model isArray="1" xpath="" > 这样可以支持一个列表页面抓取N个模型数据
0
自风
自风
sample文件夹里面有好几个类似你的需求的xml配置文件,你去看看
返回顶部
顶部