PDFBox 正在参加 2021 年度 OSC 中国开源项目评选,请投票支持!
PDFBox 在 2021 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
2021 年度 OSC 中国开源项目评选 正在火热进行中,快来投票支持你喜欢的开源项目!
2021 年度 OSC 中国开源项目评选 >>> 中场回顾
PDFBox 获得 2021 年度 OSC 中国开源项目评选「最佳人气项目」 !
授权协议 Apache
开发语言 Java
操作系统 跨平台
软件类型 开源软件
所属分类 程序开发PDF工具包
开源组织 Apache
地区 不详
投 递 者 不详
适用人群 未知
收录时间 2008-09-12

软件简介

Apache PDFBox 库是一个用于处理 PDF 文档的开源 Java 工具。该项目允许创建新的 PDF 文档、操作现有文档以及从文档中提取内容的能力。Apache PDFBox 还包括几个命令行实用工具。

主要特性包括:

  • 从PDF提取文本

  • 拆分与合并 PDF 文档

  • 填充PDF/XFDF表单数据

  • 根据 PDF/A-1b 标准验证 PDF 文件

  • 将 PDF 另存为图像文件,例如 PNG 或 JPEG

  • 打印PDF文档

  • 从头开始创建带有嵌入字体和图像的 PDF

  • 对 PDF 文件进行数字签名

展开阅读全文

评论

点击加入讨论🔥(12) 发布并加入讨论🔥
发表于大前端专区
2021/06/12 06:52

Apache PDFBox 2.0.24 发布,Java 的 PDF 处理类库

Apache PDFBox 2.0.24 已经发布。Apache PDFBox 库是一个开源的用于处理 PDF 文档的 Java 工具。 主要更新内容 对特定的 PDF 文件渲染缓慢 在 PageDrawer.shadingFill上 的渲染非常缓慢 渲染中丢失字形 对 JPEG 图像的错误分类导致在 pdf 文档中添加空白图像 嵌入文件不能从具有多级 EmbeddedFiles 树的 PDF 文件中提取出来 COSObjectKey::fixGeneration 问题 从 PDF 中提取文本时出错:无法读取嵌入的 Type1 字体 FDFBJU+NewsG...

0
4
2021/03/21 07:32

Apache PDFBox 2.0.23 发布,Java 的 PDF 处理类库

Apache PDFBox 2.0.23 已经发布。Apache PDFBox 库是一个开源的用于处理 PDF 文档的 Java 工具。 部分更新内容 Bug 修复 修复了 Transparency Group 中的问题 修复了 getLastSignatureDictionary 修改 PDDocument 内部结构的问题 修复了 AcroForm PDTextField 格式化丢失的问题 修复了 Type1Parser.parseASCII 抛出不同异常的问题 修复了 WinANSIEncoding 渲染符号 TTF 字体时出现错误字形的问题 修复了 isOwnerPassword 中的 ...

0
18
发表于开发技能专区
2019/12/27 07:39

Apache PDFBox 2.0.18 发布,Java 的 PDF 处理类库

Apache PDFBox 2.0.18 发布了。Apache PDFBox 库是一个开源的用于处理 PDF 文档的 Java 工具。 更新内容: 新特性 [PDFBOX-4682] - PDSimpleFont.isStandard14() 中的 NPE Bug [PDFBOX-4654] - PDFToImage 显示使用中的阅读器图像格式 [PDFBOX-4655] - 在 jdk11 上以默认质量使用 ImageIOUtil.WriteImage 会创建巨大的 PNG 图像 [PDFBOX-4659] - 尝试在 JAVA 1.8_222 中使用 “sun.java2d.cmm.kcms.KcmsServiceProvider” 时,重...

2
28
发表于服务端专区
2019/04/13 07:17

Apache PDFBox 存在高危 XXE 漏洞,建议升级至 2.0.15

Apache PDFBox 库是一个开源的用于处理 PDF 文档的 Java 工具。 Apache PDFBox 于 4 月 11 日发布了最新的稳定版本 2.0.15,主要是修复安全问题。点此进行下载。 发布更新后第二天,Apache 官方便在邮件中提醒 Apache PDFBox XXE(XML External Entity) 漏洞的存在。 编号为 CVE-2019-0228 的漏洞是一个 XML 外部实体漏洞。由于 Apache PDFBox 2.0.14 没有正确初始化 XML 解析器,攻击者可通过 XFDF 对其进行 XML 外部实体(X...

0
6
发表于软件架构专区
2018/12/04 07:14

Apache PDFBox 2.0.13 发布,Java 的 PDF 处理类库

Apache PDFBox 2.0.13 已发布,这是针对 2.0.12 版本的 Bug 修复版本,包含一些修复和小改进。 部分更新内容如下: [PDFBOX-4335] - Overlay should implement Closeable [PDFBOX-4363] - [Patch] Add a common interface PDShadingPaint for all shading paints [PDFBOX-4371] - Improve ExtractText utility so that it can extract rotated text automatically [PDFBOX-4375] - Change visibility of Overlay#loadPDF to pr...

3
30
发表于软件架构专区
2018/10/06 07:19

Apache PDFBox 2.0.12 和 1.8.16 版本发布

Apache PDFBox 2.0.12 已发布,包含以下改进: [PDFBOX-4184] - [PATCH]: Support simple lossless compression of 16 bit RGB images [PDFBOX-4253] - Optimize PDFunctionType3.eval() [PDFBOX-4256] - Return default value for CheckBox / RadioButton if /V entry is missing (widget /AS entries are present) [PDFBOX-4259] - Add polygon annotation to AddAnnotations.java example [PDFBOX-4260] - Reduce RAM requi...

0
6
发表于服务端专区
2018/07/01 07:09

Apache PDFBox 2.0.11 和 1.8.15, Java 的 PDF 处理类库

Apache PDFBox 2.0.11 和 1.8.15 已发布。Apache PDFBox 库是一个开源的用于处理 PDF 文档的 Java 工具库。 Apache PDFBox 2.0.11 是基于 2.0.10 版本的增量式 bug 修复版本,包含了几个修复和小改进。 Bug [PDFBOX-4248] - NPE when rendering a PDF with annotations using a g2d from Batik 改进 [PDFBOX-4251] - Optimize AFMParser 详情请查看发布公告。 同样的,Apache PDFBox 1.8.15 是基于 1.8.14 版本的增量式 bug 修复...

1
8
2018/06/23 23:19

Apache PDFBox 2.0.10 发布,Java 的 PDF 处理类库

Apache PDFBox 2.0.10 发布,Apache PDFBox 库是一个开源的用于处理 PDF 文档的 Java 工具。更新内容如下: Bug [PDFBOX-3585] - National characters not correctly displayed in text form field [PDFBOX-3631] - Signature interoperability issue / visible signature not visible on some viewers [PDFBOX-3999] - Merge failed to clone tags [PDFBOX-4097] - Compressed object will lost when brute force search faile...

0
11
发表于AI & 大数据专区
2018/04/23 07:49

Apache PDFBox 1.8.14 发布,Java 的 PDF 处理类库

Apache PDFBox 1.8.14 已发布,Apache PDFBox 库是一个开源的用于处理 PDF 文档的 Java 工具。 这是针对 1.8.13 版本的增量修补发行版,包含一些修复和小改进,主要包括: 保存 fdf 数据时使用正确的文件编码 删除 workaround 以避免出现 SSLHandshakeException 构建时新增 OWASP 依赖检查 修复在 PDPageLabels 中错误地使用 PDNumberTreeNode 的问题 修复解析时可能存在的无限循环的问题 修复部分组件渲染错误的问题 更多详情可...

1
21
发表于开发技能专区
2018/03/25 07:31

Apache PDFBox 2.0.9 发布,Java 的 PDF 处理类库

Apache PDFBox 2.0.9 已发布,Apache PDFBox 库是一个开源的用于处理 PDF 文档的 Java 工具。 这是针对 2.0.8 版本的增量修补发行版,包含一些修复和小改进,主要包括: [PDFBOX-1848] Time Stamp Document Level Sigature [PDFBOX-2092] Very slow rendering of scanned document [PDFBOX-3340] Image decoded twice without a real need [PDFBOX-3984] Add validation data of signer to document [PDFBOX-3992] Implement s...

0
24
发表了资讯
2017/11/04 07:05

Apache PDFBox 2.0.8 发布,Java 的 PDF 处理类库

Apache PDFBox 2.0.8 发布了,Apache PDFBox 库是一个开源的用于处理 PDF 文档的 Java 工具。 这个版本是bug 修复版本,包含了几个修复和改进。 bug修复: [PDFBOX-3424] - Regression from 1.8.10: IOException: XREF for 171:0 points to wrong object: 173:0 [PDFBOX-3639] - FDF does not parse: Missing root object specification in trailer. [PDFBOX-3874] - /Fontinfo instead of /FontInfo in type 1 font [PDFBOX-38...

1
26
发表了资讯
2017/07/30 07:30

PDFBox 2.0.7 发布,Java 的 PDF 处理类库

Apache PDFBox 2.0.7 已发布,Apache PDFBox 库是一个开源的用于处理 PDF 文档的 Java 工具。 这是针对 2.0.6 版本的增量式 bug 修复版本,它包含几个修复和小的改进,比如: 优化 TrueType 字体嵌入器 PDDeviceRGB.toRGBImage 应返回一个 RGB 类型的图像 PrintBookmarks 示例中的输出目标页面 优化 COSStream 结构 添加 OWASP 依赖检查 更多内容可查阅发行说明 下载地址: http://pdfbox.apache.org/download.cgi >>>【评论有礼...

2
43
发表了资讯
2017/05/16 15:09

PDFBox 2.0.6 发布,Java 的 PDF 处理类库

Apache PDFBox 2.0.6 发布了,Apache PDFBox 库是一个开源的用于处理 PDF 文档的 Java 工具。 这个版本是基于 2.0.5 版本的增量式 bug 修复版本,包含了几个修复和小改进,更新如下: Bug 修复 [PDFBOX-3313] - Java 9 InaccessibleObjectException [PDFBOX-3318] - IllegalArgumentException in PDPageTree constructor: root cannot be null [PDFBOX-3347] - COSName parsing doesn't handle ISO-8859-1 encoded bytes [PDFB...

5
72
发表了资讯
2017/03/18 07:25

Apache PDFBox 2.0.5 发布,Java 的 PDF 处理类库

Apache PDFBox 2.0.5 发布了,Apache PDFBox 库是一个开源的用于处理 PDF 文档的 Java 工具。 这个版本是基于 2.0.4 版本的增量式 bug 修复版本,包含了几个修复和小改进。 改进 [PDFBOX-3564] - SoftMask needs consider colormodel of input Image [PDFBOX-3576] - Add getter methods to TextPosition [PDFBOX-3635] - Remove workaround to avoid SSLHandshakeException [PDFBOX-3652] - PDFMergerUtility: The source out...

2
45
发表了资讯
2016/12/18 08:30

Apache PDFBox 2.0.4,Java 的 PDF 处理类库

Apache PDFBox 2.0.3 发布了。Apache PDFBox库是一个开源的Java工具用于处理PDF文档。该版本修复了一些bug以及功能的提升。 更新内容: Bug 修复: [PDFBOX-3300] - 缺少字形时的显示空格 [PDFBOX-3375] - 对单例使用静态锁 [PDFBOX-3396] - 压缩AcroForm与可见标志字段ETSI.CAdES.detached ...... 提升: [PDFBOX-3262] - AcroForm flattening will cause hidden fields become visible [PDFBOX-3432] - Optimize CID to GlyphId...

4
96
发表了资讯
2016/09/18 00:00

Apache PDFBox 2.0.3,Java 的 PDF 处理类库

Apache PDFBox 2.0.3 发布了。Apache PDFBox库是一个开源的Java工具用于处理PDF文档。该版本修复了一些bug以及功能的提升。 更新内容: Bug [PDFBOX-2420] - DateConverter doesn't handle time zones outside -12 to +12 range properly [PDFBOX-2854] - TTFSubsetter NoSuchElementException [PDFBOX-2919] - org.apache.fontbox.cff.CFFParser.readEntry sometimes throws java.lang.IllegalArgumentException [PDFBOX-2984]...

2
41
发表了资讯
2016/04/28 00:00

Apache PDFBox 1.8.12 发布

Apache PDFBox 1.8.12 发布了。 PDFBox是Java实现的PDF文档协作类库,提供PDF文档的创建、处理以及文档内容提取功能,也包含了一些命令行实用工具。 主要特性包括: 从PDF提取文本 合并PDF文档 PDF 文档加密与解密 与Lucene搜索引擎的集成 填充PDF/XFDF表单数据 从文本文件创建PDF文档 从PDF页面创 建图片 打印PDF文档 一些提升: [PDFBOX-1840] - Automatically load isartor for preflight tests [PDFBOX-3196] - Update mave...

0
35
发表了资讯
2016/04/27 00:00

Apache PDFBox 2.0.1 发布,Java 的 PDF 处理类库

Apache PDFBox 2.0.1 发布了。 更新日志: Bug [PDFBOX-3272] - Loaded fonts file descriptors open after closing document [PDFBOX-3273] - Fonts not rendered correctly [PDFBOX-3276] - Double encryption dictionary for files with XRef stream [PDFBOX-3279] - PDDocument.importPage creates two inputstreams [PDFBOX-3281] - HTML output wrongly specifies UTF-16 in header [PDFBOX-3286] - Think I found a bad...

1
30
发表了资讯
2016/01/19 00:00

Apache PDFBox 1.8.11 发布,Java 的 PDF 处理类

Apache PDFBox 1.8.11 发布,此版本是个增量 bug 修复版本,包括大量 bug 修复和改进。 现已提供下载: http://pdfbox.apache.org/download.cgi 主要改进内容: Bug 修复 [PDFBOX-962] - All sort of Problems when importing Xfdf files into PDFs -> damaged pdfs and NPEs [PDFBOX-2508] - Text extraction getting zero font height, bad widths, and ? for text in this PDF with Type 3 Fonts [PDFBOX-2693] - OutOfMe...

3
33
发表了资讯
2016/01/17 00:00

Apache PDFBox 2.0.0 RC3 发布

Apache PDFBox 2.0.0 RC3 发布,此版本现已提供下载: http://pdfbox.apache.org/download.cgi RC2 版本收到大量的反馈,此版本做了许多的改进,比如:优化字体缓存,改进文本提取,大量 bug 修复等等。此版本的 API 被认为是稳定的,详细改进内容请看发行说明。 PDFBox是Java实现的PDF文档协作类库,提供PDF文档的创建、处理以及文档内容提取功能,也包含了一些命令行实用工具。 主要特性包括: 从PDF提取文本 合并PDF文档 PD...

2
21
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了博客
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
发表了问答
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
暂无内容
12 评论
466 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部