我想在Nutch创建索引的时候只创建Feed的索引,其他的Html都不要,但是不知道从哪入手,能否指导一下?

mixhowie 发布于 2014/03/25 15:52
阅读 196
收藏 0

@杨尚川 你好,想跟你请教个问题:

我在研究Nutch这个爬虫框架,现在我想在Nutch抓取网页的时候只抓Feed,也就是RSS源,而其他的Html之类网页不被索引。

请教下该从哪入手?

加载中
返回顶部
顶部