DevOps研发效能
媒体矩阵
开源中国APP
授权协议 MIT
开发语言 Python HTML/CSS
操作系统 跨平台
软件类型 开源软件
开源组织
地区 不详
投 递 者 白开水不加糖
适用人群 未知
收录时间 2025-02-26

软件简介

Docling 简化了文档处理,解析各种格式(包括高级 PDF 理解),并提供与 gen AI 生态系统的无缝集成。

  • 解析多种文档格式,包括 PDF、DOCX、XLSX、HTML、图像等
  • 高级 PDF 理解,包括页面布局、阅读顺序、表格结构、代码、公式、图像分类等
  • 统一、富有表现力的DoclingDocument表现格式
  • 各种导出格式和选项,包括 Markdown、HTML 和无损 JSON
  • 针对敏感数据和隔离环境的本地执行能力
  • 即插即用集成,包括 LangChain、LlamaIndex、Crew AI 和用于代理 AI 的 Haystack
  • 广泛支持扫描的 PDF 和图像的 OCR
  • 简单方便的 CLI

展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论

点击引领话题📣 发布并加入讨论🔥
暂无内容
发表了博客
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
发表了问答
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
暂无内容
0 评论
1 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部