开源中国

我们不支持 IE 10 及以下版本浏览器

It appears you’re using an unsupported browser

为了获得更好的浏览体验,我们强烈建议您使用较新版本的 Chrome、 Firefox、 Safari 等,或者升级到最新版本的IE浏览器。 如果您使用的是 IE 11 或以上版本,请关闭“兼容性视图”。
Smart and Simple Web Crawler首页、文档和下载 - Web爬虫框架 - 开源中国社区
全部项目分类
我要评价
未知
Java
跨平台
分享
收藏
22 人收藏
收录时间:2009-11-30
Smart and Simple Web Crawler 详细介绍

Smart and Simple Web Crawler是一个Web爬虫框架。集成Lucene支持。该爬虫可以从单个链接或一个链接数组开始,提供两种遍历模式:最大迭代和最大深度。可以设置 过滤器限制爬回来的链接,默认提供三个过滤器ServerFilter、BeginningPathFilter和 RegularExpressionFilter,这三个过滤器可用AND、OR和NOT联合。在解析过程或页面加载前后都可以加监听器。介绍内容来自Open-Open

下载地址:

https://crawler.dev.java.net/servlets/ProjectDocumentList?folderID=11459&expandFolder=11459&folderID=10340


大家对 Smart and Simple Web Crawler 的评论 (全部 0 条评论)
{{repayCom.userName}}
顶部