高保真PDF至HTML转换 pdf2htmlEX

GPL
跨平台
2012-09-05
王璐

pdf2htmlEX可以将PDF转换成HTML,不同于传统类似软件,它可以:

  • 在HTML文件中精确显示原生文本
    • 保持PDF中的字体,颜色,位置
    • 可以选择,复制,搜索
  • 生成的文件大小与解压缩后的PDF文件相当,如果放到支持HTTP压缩的服务器上,网络消耗和PDF相当
  • [可选]单HTML文件输出

转换效果实例:

pdf2htmlEX适用于将PDF在线发布,使用案例

  • 在个人主页发布个人简历,在其中嵌入流量统计代码
  • 内容发布商(报纸,杂志,电子书)提供在线阅读服务,可以加入权限管理,广告,个性化内容
  • 网盘服务,PDF在线预览 (MediaFire目前使用pdf2htmlEX)

说明:作者不常上开源中国。如有问题,欢迎通过邮件列表(中文)讨论,地址是:

https://groups.google.com/forum/#!forum/pdf2htmlex-cn


加载中

评论(12)

红薯
红薯
这工具转出来的 HTML 效果非常好,但浏览器来好卡啊 pdf2htmlEX
主编
主编
国外有个 pdf2html5 的drupal插件 http://goo.gl/UotD0 pdf2htmlEX
代码会说话
代码会说话
我看到单文件,我就Orz了。多文件才对嘛!要不就跟@红薯 说的一样了。 pdf2htmlEX
c
chinapumed
非常棒! pdf2htmlEX
缪斯的情人
缪斯的情人
好东西! pdf2htmlEX
S
Steven Li
pdf2htmlEX windows 版本出来了 http://blog.rubypdf.com/2013/08/19/pdf2htmlex-windows-verion-release/ pdf2htmlEX
IT深蓝
IT深蓝
非常棒,就是不知道如何在centos上安装,以及相关依赖的东西,请大神详解啊。 pdf2htmlEX
项伯羽
不支持ie8啊 pdf2htmlEX
CheneyWong
CheneyWong
真心好软件,忍不住去做些非法的事情了. pdf2htmlEX
CheneyWong
CheneyWong
真心好软件,忍不住去做些非法的事情了. pdf2htmlEX

pdf2htmlEX v0.8 发布,PDF 转 HTML 工具

pdf2htmlEX v0.8已经发布,相较于之前的版本,这一版本带来大量Bug修复和新功能,包括: HTML优化 新的主题 支持打印 支持简单的clipping path 项目主页:https://github.com/coolwanglu/pdf...

2013/05/05 17:56

没有更多内容

加载失败,请刷新页面

没有更多内容

4
回答
请问有什么可以将PDF转换成HTML的开源工具推荐的?

想要将PDF转成标签语义比较明确的HTML页面,目前找到的开源框架PDFBox和iText都只支持对划定坐标区域的表格进行识别转换而不能自动识别,因为PD...

2018/06/23 09:48
1
回答
请问有谁做过将pdf转为html格式的功能

我最近在做将pdf转为html,并且在网页上显示内容,但是我之前用xpdf转的时候出现乱码,我今天又用pdf2htmlEX将pdf转为html,但是出错了...

2015/10/21 15:31
2
回答
pdf2htmlEX怎样提高图片清晰度

使用pdf2htmlEx将pdf转为html,怎样设置才能提高转换完后的html里面图片的清晰度

2014/03/11 11:15
1
回答
你的软件是否能把PDF的信息读取出来呢?

例如:我已经做好的PDF上传上来了,里面有电话号码,我想把里面的电话号码的信息读取出来,保存入数据库,您看你能解决么,急用啊~~~~页面版更好(备注:php)

2013/04/11 10:20
2
回答
Error: cannot locate fontforge.h

@王璐 你好,想跟你请教个问题: 报错如下: [root@localhost coolwanglu-pdf2htmlEX-a124926]# cmake ...

2013/09/12 10:33
4
回答
pdf2htmlEX编译遇到的问题

@王璐 你好,想跟你请教个问题: 我在编译pdf2htmlEX的时候遇到和需要得到帮助的问题: 1.能否把c++0x的编译特性去掉,我机器gcc的版本比较...

2012/12/21 10:06
3
回答
Linux 64bit版的pdf2htmlEX有编译成功的吗?

Linux 64bit版的pdf2htmlEX有编译成功的吗?

2012/10/02 21:01
2
回答
在MacOSX下无法编译pdf2htmlex

cmake提示找不到python的fontforge库? 看不太懂........ 有人编译成功了么?

2012/09/17 09:58

没有更多内容

加载失败,请刷新页面

没有更多内容

CentOS6.4 上编译 pdf2htmlex

同时参考:https://github.com/coolwanglu/pdf2htmlEX/issues/44 编译fontforge 直接git clone下来的代码,貌似和glib2的版本不太匹配。于是我是下的他的一个tag,然后编译的。 wget https...

2015/04/30 12:07
181
0
centos安装pdf2htmlEX

1.安装基本工具和依赖库 yum install vim unzip wget git gcc* cmake poppler* libtool* glib* gio* freetype* pango* cairo* -y 2.安装fontforge wget https://github.com/coolwanglu/font...

01/28 09:59
81
0
pdf2htmlEX实现pdf转html

首先要感谢pdf2htmlEX的作者Lu Wang,该软件是一个pdf转html的开源软件,效果非常理想。下面两张图片是html和pdf视图下的截图: windows下载地址pdf2htmlEX-v1.0-win32-static 本人开发的一个...

2014/03/10 17:10
14.6K
2
Coding and Paper Letter(五十二)

资源整理。比较久没更新,内容比较多,老规矩拆分为两篇,第一篇Coding,第二篇Paper。 Coding: 1.Python库pyPhenology,基于scikit-learn API激发的灵感用python开发的植物物候模型。 pyPh...

03/16 20:36
26
0
PDF转HTML神器pdf2htmlEX,解决跨平台问题

在手机端展示PDF是移动开发者的一大痛点 目前在PC端展示PDF有较多的解决方案,比如: PC端 embed标签 <embed type="application/pdf" src="test.pdf" width="100%" height="100%"/> pdf.js 这...

2016/11/02 16:29
4.4K
0
死磕 Elasticsearch 方法论:普通程序员高效精进的 10 大狠招!

开篇 人工智能、大数据快速发展的今天,对于 TB 甚至 PB 级大数据的快速检索已然成为刚需。Elasticsearch 作为开源领域的后起之秀,从2010年至今得到飞跃式的发展。 Elasticsearch 以其开源、...

2018/12/18 14:42
217
0
PHP各种实用的东东

估计大部分人都会有这样的问题,在平常玩微博或的时候看到别人分享的一些实用的东西,比如一些NB的js库,或者php组件等等。看完当时加入了浏览器书签。但是出现的现象就是很少去翻它,或者说...

2016/02/05 13:15
81
2

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部