PaddleOCR是基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。
## CPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle
## GPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu
PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。
特性
- 超轻量级中文OCR,总模型仅8.6M
- 单模型支持中英文数字组合识别、竖排文本识别、长文本识别
- 检测模型DB(4.1M)+识别模型CRNN(4.5M)
- 多种文本检测训练算法,EAST、DB
- 多种文本识别训练算法,Rosetta、CRNN、STAR-Net、RARE
支持的中文模型列表:
模型名称 | 模型简介 | 检测模型地址 | 识别模型地址 |
---|---|---|---|
chinese_db_crnn_mobile | 超轻量级中文OCR模型 | inference模型 & 预训练模型 | inference模型 & 预训练模型 |
chinese_db_crnn_server | 通用中文OCR模型 | inference模型 & 预训练模型 | inference模型 & 预训练模型 |
超轻量级中文OCR在线体验地址:https://www.paddlepaddle.org.cn/hub/scene/ocr
也可以按如下教程快速体验超轻量级中文OCR和通用中文OCR模型。
超轻量级中文OCR以及通用中文OCR体验
上图是超轻量级中文OCR模型效果展示,更多效果图请见文末超轻量级中文OCR效果展示和通用中文OCR效果展示。
评论