图像识别类库 Tesseract OCR

Apache
C/C++
Windows
2010-01-28
江鸟

完善个人资料领开源豆,速来抽奖!>>>

Tesseract OCR 该软件包包含一个OCR引擎 -  libtesseract和一个命令行程序 -  tesseract。 Tesseract 4增加了一个基于OCR引擎的新神经网络(LSTM),该引擎专注于线路识别,但仍然支持Tesseract 3的传统Tesseract OCR引擎,该引擎通过识别字符模式来工作。通过使用Legacy OCR Engine模式(--oem 0)启用与Tesseract 3的兼容性。它还需要训练有素的数据文件,这些文件支持传统引擎,例如来自tessdata存储库的文件。

Tesseract 架构:

首席开发人员是Ray Smith。维护者是Zdenko Podobny。有关贡献者的列表,请参阅AUTHORS和GitHub的贡献者日志。

Tesseract 支持 unicode(UTF-8),可以“开箱即用” 识别100多种语言。

Tesseract支持各种输出格式:纯文本,hOCR(HTML),PDF,不可见文本的PDF,TSV。主分支还具有ALTO(XML)输出的实验支持。

您应该注意,在许多情况下,为了获得更好的OCR结果,需要提高您给Tesseract的图像质量。

该项目不包括GUI应用程序。如果您需要,请参阅3rdParty维基页面。

可以训练Tesseract识别其他语言。有关详细信息,请参阅Tesseract培训

支持的编译器:

  • GCC 4.8 and above
  • Clang 3.4 and above
  • MSVC 2015, 2017, 2019
的码云指数为
超过 的项目
加载中

评论(2)

sxgkwei
sxgkwei
这玩意儿,只去识别一行行的文本,效果还行。但只要带上表格,效果奇差,它不会自动忽略表格线的感觉。
chensiun
chensiun
推荐一个在线免费文字识别工具:ocrmaker 效果还行

Tesseract-ocr 3.0发布,支持中文

tesseract-ocr是一 个OCR引擎,在1985年到1995年由HP实验室开发,现在在Google。tesseract-ocr 3.0发布,支持中文。不过tesseract-ocr 3.0不是图形化界面的客户端,别人写的FreeOCR图形化客户...

2010/10/03 22:44

没有更多内容

加载失败,请刷新页面

没有更多内容

1
回答
tesseract-ocr

版本:tesseract 3.05.01 leptonica-1.74.1 libgif 4.1.6(?) : libjpeg 8d (libjpeg-t...

2018/10/21 17:39
2
回答
Tesseract 3.02中文字库训练怎么创建font_properties文件?

菜鸟请教一个问题,Tesseract 3.02中文字库训练怎么创建font_properties文件? 好像创建一个名为font_properties的t...

2016/11/09 10:07
2
回答
java 图片文字识别用tesseract还是其他的好

现在做一个车牌号识别,基于java的,用什么技术比较好,tesseract识别率不高,谁能给点提示交通部门之类是用什么做的

2012/10/31 12:39
7
回答
Runnable Jar中使用jna调用DLL文件,找不到指定模块

问题描述: Windows环境,使用tess4j.jar进行OCR识别,tess4j中使用JNA加载gsdll32.dll、liblept171.dll和...

2016/05/01 19:50
2
回答
提升Tesseract OCR準確度?

我想请教一下,我想在android上做一个关于读取名片转成通讯录的app,我用tesseract-ocr,我爬文发现要提高ocr的准确度应该先train一...

2016/01/25 14:38
2
回答
ocr中文和英文混合识别怎么做啊?
wharf_zhang 的回答 2014/10/28 22:48
最佳答案
1,分割字符,2,图像识别,3,查库匹配,4,整合所有结果。OVER
1
回答
tesseract-ocr怎么设置只匹配数字+大写字母?怎么设置字符的宽度?

tesseract-ocr怎么设置只匹配数字+大写字母? 怎么设置字符的宽度?(size) 如何用jtessboxEditor训练?

2014/07/16 16:57
5
回答
图像识别技术是否支持中文呢?

图像识别技术在那里能够看到相关技术文档? 现在技术是否成熟呢?

2012/06/20 18:43
1
回答
opencv菜鸟求问xcode使用方法

在写一个关于ocr的ios软件时,需要加入一个opencv的framework。刚开始的时候还能运行,隔了几天再运行就出现了以上错误,根本什么都没动过。发...

2014/09/18 18:35
1
回答
如何使用 tesseract ocr 呢?

官方文档只有介绍跟安装说明,没有使用说明 在自己的程序中如何使用libtesseract.so这个库呢?

2014/04/29 22:27

没有更多内容

加载失败,请刷新页面

Tesseract-OCR-02-Tesseract-OCR 的安装与 环境变量配置

Windows 下 Tesseract-OCR 的安装与 环境变量配置 本篇介绍Windows下Tesseract-OCR的安装与环境配置,然后做一个图片的文字识别测试 Windows下 Tesseract-OCR 的安装 Tesseract-OCR Windows安...

2018/09/07 14:20
66
0
图片文字OCR识别-tesseract-ocr

  帮助文件:https://github.com/tesseract-ocr/tesseract/blob/master/doc/tesseract.1.asc   下载地址:https://github.com/tesseract-ocr/tesseract/wiki   如何使用提供的工具来训...

2018/07/27 11:26
98
0
Centos5.5 安装Tesseract-OCR

安装Tesseract-OCR 准备工作: 编译环境: gcc gcc-c++ make(这个环境一般机器都具备,可以忽略) yum install gcc gcc-c++ make 依赖的包: autoconf automake libtool libjpeg-devel libpng-de...

2012/02/15 17:23
7.6K
1
OCR库Tesseract初探

1.Tesseract 安装及使用 一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断...

2019/04/25 16:16
23
0
tesseract-ocr,tesseract,pytesseract在windows下怎么安装

废话不多说,直接介绍如何下载安装tesseract-OCR以及pytesseract和PIL资源 文末百度网盘都有 Tesseract是一个开源的OCR引擎,能识别100多种语言(中,英,韩,日,德,法…等等)pytesseract...

2019/08/29 22:29
25
0
【c#】Tesseract-ocr 3.0.2 版本使用实例

简介 光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。OCR技术非常专业,一般多是印刷、打印行业的从业人...

2018/05/07 17:49
107
0
tesseract-ocr训练方法

tesseract-ocr有2和3两个版本,不同版本训练方法稍有不同。 第3版本的训练方法官版教程在这里:TrainingTesseract3 第2版的训练方法官版教程在这里:TrainingTesseract 我使用的是最新的3.0...

2012/05/30 08:52
3.4W
3
Tesseract-OCR-03-图片文字识别

Tesseract-OCR-03-图片文字识别 本篇介绍使用 Tesseract-OCR 做图片文字识别,识别手写文字的时候,正确率能达到 90%,当训练后正确率是极高的。这里介绍的图片文字识别,可以识别英文,数字...

2018/09/07 14:36
66
0
Windows安装Tesseract-OCR 4.00并配置环境变量

一、前言 Tesseract-OCR 是一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎。与Microsoft Office Document Imaging(MODI)相比,我们可以不...

2019/08/07 22:26
27
0
Tesseract-OCR的简单使用与训练

Tesseract-OCR的简单使用与训练 Tesseract,一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)...

2018/10/17 14:35
33
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部