PdfParser 0.9.19 发布,PHP 的 PDF 解析库

oschina
 oschina
发布于 2014年01月31日
收藏 8

PdfParser 0.9.19 修复了 xobject 文本抽取和在字体丢失情况下增加文本回退的特性。

PdfParser 是一个标准的 PHP 库提供个用于从 PDF 文件中抽取数据的工具。它加载 PDF 文件并解析文件中对象、头和元数据,可抽取其中的文本信息,支持压缩的 PDF、MAC OS 罗马字符集编码、8进制和16进制编码。兼容 PSR-0 和 PSR-1。

示例代码:

$document = \Smalot\PdfParser\Document::parseFile('document.pdf');
$pages    = $document->getPages();
$text     = $pages[1]->getText();
本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 OSCHINA 社区 [http://www.oschina.net]
本文标题:PdfParser 0.9.19 发布,PHP 的 PDF 解析库
加载中
返回顶部
顶部