抓取网站数据工具 templatespider

Apache
Java
跨平台
2018-02-09
鬼画符

扒网站工具,看好哪个网站,指定好URL,自动扒下来做成模版。所见网站,皆可为我所用!扒下来的网站,会自动变成html模版。js、css、图片等自动分好类,变为标准的模版文件。可以供网市场云建站、帝国CMS、织梦CMS等各大建站系统使用

软件界面

image

使用步骤

  1. 将要扒取的网站页面的网址粘贴进去

  2. 点击左下方“开始抓取”按钮

  3. 等待抓取完毕,自动打开下载好的文件夹

使用示例

例如,我要拔取 qiye1.wscso.com 这个网站中的首页、关于我们、新闻列表三个页面,拔取下来做成模板,扒网站工具中可以这么设置URL:

http://qiye1.wscso.com
http://qiye1.wscso.com/gongsijieshao.html
http://qiye1.wscso.com/xinwenzixun.html

设置如下图所示

 image

设置好后,点击左下角的“开始提取”按钮,便开始了自动扒这几个设置好的页面。

扒完后,会自动打开下载好的文件夹。例如,上面拔取的结果:

 image

可以看到,扒取下来的网页算是很规范的模板页。可以直接打开模板页进行浏览查看。

的码云指数为
超过 的项目
加载中

评论(1)

天堂鸟go
我刚刚写了一个类似的,不过还没有写成客户端式。用Java写,利用爬虫方面的知识,爬取指定URL的网页赋给字符串,然后创建并写入一个本地html文件. 后续完善:学习正则,分析html文件,把链接做成列表,并指出图片链接、视频或音频链接、站内链接和站外链接等。 还可以尝试用图形表达html层次(不过这个我还没什么头绪了)。

扒网站工具 v2.2 发布:所见网站,皆可为我所用!

扒网站工具 v2.2 已发布,扒网站工具,看好哪个网站,指定好URL,自动扒下来做成模版。所见网站,皆可为我所用! 所下载的css、js、图片、html文件会自动分好类保存到特定文件夹! 如果你想吧...

2018/11/17 11:42

扒网站工具发布 v2.1 版本,所见网站,皆可为我所用!

扒网站工具 v2.1 已发布,扒网站工具,看好哪个网站,指定好URL,自动扒下来做成模版。所见网站,皆可为我所用! 所下载的css、js、图片、html文件会自动分好类保存到特定文件夹! 如果你想吧...

2018/10/19 09:22

扒网站工具 v2.0 发布,发布模版计算工具等

扒网站工具 v2.0 已发布,扒网站工具,看好哪个网站,指定好URL,自动扒下来做成模版。所见网站,皆可为我所用!扒下来的网站,会自动变成html模版。js、css、图片等自动分好类,变为标准的模...

2018/05/15 23:26

扒网站工具 templatespider v1.2 版本更新

软件简介 扒网站工具,看好哪个网站,指定好URL,自动扒下来做成模版。所见网站,皆可为我所用!扒下来的网站,会自动变成html模版。js、css、图片等自动分好类,变为标准的模版文件。可以供...

2018/02/23 16:29

没有更多内容

加载失败,请刷新页面

没有更多内容

暂无问答

D2 日报 第156期 2019年7月26日

🔩 开源项目 ➡️ jiangwei1995910/getAwayBSG watch 12 star 469 fork 33 逃离北上广 github.com ➡️ qiyeboy/IPProxyPool watch 220 star 3498 fork 1162 IPProxyPool代理池项目,提供代...

07/25 21:43
28
0

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部