如何抓取爬取网站文章将图片保存到本地并将HTML的src属性更改到本地,实现离线访问。

cuiran 发布于 08/06 11:17
阅读 138
收藏 0

 根据项目需求,需要爬取网站文章将图片保存到本地为html,并将HTML的src属性更改到本地,实现离线访问,试过好几种爬取网址的方法都是把源代码存为html,但是图片的src还是用的服务器。

加载中
0
金老湿Plus
金老湿Plus

一、保存html到本地

2、保存图片到本地

叁、修改html的src属性值

 

使用nodejs比较f'b

cuiran
cuiran
目前通过python可以将html保存在本地了,感谢推荐用nodejs 我来试试。
0
画面
画面

你需要写程序 把src里面的链接改成本地, 按照本地存放图片等资源的层级。

 

0
前端大师傅
前端大师傅

图片把它改成base64字符串就可以和html保存在一起了。原理同电子邮件保存到本地是一样的。

0
张朋举
张朋举
多款离线浏览器可以做到
返回顶部
顶部