ArchiveBox 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
ArchiveBox 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票
ArchiveBox 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」 !
ArchiveBox 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」「最积极运营项目」 !
ArchiveBox 获得 2020 年度 OSC 中国开源项目评选「最积极运营项目」 !
授权协议 MIT
开发语言 Python HTML/CSS SHELL
操作系统 Windows
软件类型 开源软件
所属分类 管理和监控数据备份
开源组织
地区 不详
投 递 者 白开水不加糖
适用人群 未知
收录时间 2021-07-20

软件简介

ArchiveBox 是一个强大的、自我托管的互联网归档解决方案,可以收集、保存和查看你想离线保存的网站。

你可以在 Linux、macOS 和 Windows 上将其设置为命令行工具、网络应用和桌面应用(alpha)。

你可以一次给它提供一个URL,或者安排定期从浏览器书签或历史记录、RSS 等提要、Pocket/Pinboard 等书签服务等定期导入。它以多种格式保存你提供的 URL 的快照:HTML、PDF、PNG屏幕截图、WARC等开箱即用,并自动提取和保存各种内容(文章文本、音频/视频、git repos 等)。

其目标是将用户所关心的互联网部分以持久的、易于访问的格式自动保存下来,直到它消失后的几十年。

特性:

  • 免费和开放源代码,不需要注册任何东西,所有数据都存储在本地
  • 强大的、直观的命令行界面,具有模块化的可选依赖性
  • 全面的文档、活跃的开发和丰富的社区
  • 开箱即可提取各种内容:媒体(优酷-DL)、文章(可读性)、代码(Git)等。
  • 支持从多种类型的来源按计划/实时导入
  • 使用标准、持久、长期的格式,如HTML、JSON、PDF、PNG和WARC
  • 可作为一次性CLI、自我托管的Web UI、Python API(BETA)、REST API(ALPHA)或桌面应用程序(ALPHA)使用
  • 默认情况下将所有页面保存到archive.org,以实现冗余(可以禁用本地模式)。
  • 计划中:支持需要登录/付费墙/cookies的归档内容(正在运行,但在一些有待修复的问题发布之前,不建议使用)。
  • 计划中:支持在归档过程中运行JS,如广告屏蔽、自动滚动、模式隐藏、线程扩展等。

展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论 (0)

加载中
更多评论
暂无内容
发表了博客
02/06 12:35

科技爱好者周刊(第 144 期):提高收入的根本途径

这里记录每周值得分享的科技内容,周五发布。 本杂志开源(GitHub: ruanyf/weekly),欢迎提交 issue,投稿或推荐科技内容。 周刊讨论区的帖子《谁在招人?》,提供大量程序员就业信息,欢迎访问或发布工作/实习岗位。 封面图 上海正在举办白玉兰冰雪节,搭建了本地难得一见的室外真冰溜冰场。(via) 本周话题:提高收入的根本途径 我看到一个故事,很有启发,给大家讲一下。 挪威和孟加拉是两个截然不同的国家,但是它们有一个...

0
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
暂无内容
0 评论
1 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部