Tesseract OCR 正在参加 2021 年度 OSC 中国开源项目评选,请投票支持!
Tesseract OCR 在 2021 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
2021 年度 OSC 中国开源项目评选 正在火热进行中,快来投票支持你喜欢的开源项目!
2021 年度 OSC 中国开源项目评选 >>> 中场回顾
Tesseract OCR 获得 2021 年度 OSC 中国开源项目评选「最佳人气项目」 !
授权协议 Apache
开发语言 C/C++
操作系统 Windows
软件类型 开源软件
所属分类 程序开发OCR开发包
开源组织
地区 不详
投 递 者 江鸟
适用人群 未知
收录时间 2010-01-28

软件简介

Tesseract OCR 该软件包包含一个OCR引擎 -  libtesseract和一个命令行程序 -  tesseract。 Tesseract 4增加了一个基于OCR引擎的新神经网络(LSTM),该引擎专注于线路识别,但仍然支持Tesseract 3的传统Tesseract OCR引擎,该引擎通过识别字符模式来工作。通过使用Legacy OCR Engine模式(--oem 0)启用与Tesseract 3的兼容性。它还需要训练有素的数据文件,这些文件支持传统引擎,例如来自tessdata存储库的文件。

Tesseract 架构:

首席开发人员是Ray Smith。维护者是Zdenko Podobny。有关贡献者的列表,请参阅AUTHORS和GitHub的贡献者日志。

Tesseract 支持 unicode(UTF-8),可以“开箱即用” 识别100多种语言。

Tesseract支持各种输出格式:纯文本,hOCR(HTML),PDF,不可见文本的PDF,TSV。主分支还具有ALTO(XML)输出的实验支持。

您应该注意,在许多情况下,为了获得更好的OCR结果,需要提高您给Tesseract的图像质量。

该项目不包括GUI应用程序。如果您需要,请参阅3rdParty维基页面。

可以训练Tesseract识别其他语言。有关详细信息,请参阅Tesseract培训

支持的编译器:

  • GCC 4.8 and above
  • Clang 3.4 and above
  • MSVC 2015, 2017, 2019
展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论

点击加入讨论🔥(2) 发布并加入讨论🔥
发表了资讯
2021/12/04 07:45

Tesseract 5.0 发布,开源 OCR 引擎

Tesseract 是一个最初由惠普公司开发的 OCR 引擎,并于 2005 年开源,Google 在第二年接管了项目的大部分开发工作。 Tesseract 5.0 发布,更新内容如下: 原生支持 Apple Silicon 默认情况下,训练和识别速度更快; 更多的二值化选项 改进了对 ARM NEON 的支持 现代化的代码 从公共 API 中删除了专有数据类型,如 GenericVector 和 STRING 不再需要 pdf.ttf,现在集成到了代码中 使用 automake 更快地进行平面构建 combine_tess...

5
29
发表了资讯
2010/10/03 00:00

Tesseract-ocr 3.0发布,支持中文

tesseract-ocr是一 个OCR引擎,在1985年到1995年由HP实验室开发,现在在Google。tesseract-ocr 3.0发布,支持中文。不过tesseract-ocr 3.0不是图形化界面的客户端,别人写的FreeOCR图形化客户端还不支持导入新的 3.0 traineddata。但这标志着,现在有自由的中文OCR软件了。

4
16
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了博客
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
发表了问答
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
暂无内容
2 评论
449 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部