将oschina收藏的博客在线转换为PDF文档

hibegin 发布于 2016/08/01 22:30
阅读 191
收藏 0


前一段时间无意获得了一个Kindle,有时候无聊的时候会简单的看下简单的看了下里面与技术相关的书籍大多都是收费的,结合自己之前的又比较喜欢浏览osc自己收藏的文章的习惯。于是就简单的想了下能不能将osc的文章放到Kindle上浏览。

http://reader.94fzb.com ,oschina.net 收藏博客生成PDF文档工具

简单记录相关内容

准备

  • osc 的 openApi的apiKey和 shareSecrect
  • 能生成pdf的工具
  • 一个可以快速构建web项目(基于 simplewebserver
  • 通过Kindle的服务端转换后的.azw格式比较良好(分段做的比较好,pdf文档进行缩放会出现滚动条)

实现

接入OAuth

没有什么特别需要注意的地方

生成pdf

  • itext 对于表单这些可以生成相对格式的,不容易控制格式。需要单独学习,中文乱码需要特殊处理。
  • pdfbox 功能强大不仅可以生成pdf,还能读取pdf(不过这里永不到)
  • wkhtmltopdf 目前还是比较喜欢这个工具生成的,只是需要使用模板语言渲染为html就可以,通过html的h1->h6的标签支持大纲。Java这个方面有很多工具可以做,于是选择了自己相对较熟悉的freemarker

还是比较熟悉第三种做法,只需要在对应的系统上安装这个软件就可以了。

安装 wkhtmltopdf

apt-get install wkhtmltopdf(这种方式安装的版本一般比较老)

http://wkhtmltopdf.org/官网 下载最新的程序安装包

wget https://bitbucket.org/wkhtmltopdf/wkhtmltopdf/downloads/wkhtmltox-0.13.0-alpha-7b36694_linux-trusty-amd64.deb 
dpkg -i wkhtmltox-0.13.0-alpha-7b36694_linux-trusty-amd64.deb 

如果下载国外资源比较的慢可以尝试上传到七牛的文件
wget http://7s1rev.com1.z0.glb.clouddn.com/wkhtmltox-0.12.2.1_linux-trusty-amd64.deb

可能会提示缺少 x-font,使用 apt-get install -f 就可以了。
服务器环境需要安装对应的中文字体

sudo apt-get install fonts-wqy-zenhei

调用 wkhtmltopdf

对html文件的转换
wkhtmltopdf 1.html 1.pdf

直接转化网络地址
wkhtmltopdf http://blog.94fzb.com 1.pdf

加载中
返回顶部
顶部