RapidOCR 是一款基于 PaddleOCR & OnnxRuntime & OpenVINO 的跨平台 OCR 库。
特性
- 目前已知运行速度最快、支持最广,完全开源免费并支持离线快速部署的多平台多语言OCR。
- 支持的语言: 默认是中英文,其他语言识别需要自助转换。具体参考这里
- 缘起:百度paddlepaddle工程化不是太好,为了方便大家在各种端上进行ocr推理,顾将它转换为onnx格式,使用
Python/C++/Java/Swift/C#
将它移植到各个平台。 - 名称来源: 轻快好省并智能。基于深度学习技术的OCR技术,主打人工智能优势及小模型,以速度为使命,效果为主导。
- 使用:
- 如果仓库下已有模型满足要求 → RapidOCR部署使用即可。
- 不满足要求 → 基于PaddleOCR在自己数据上微调 → RapidOCR部署。
文档导航
- Wiki
- Python范例
- C++范例(Windows/Linux/macOS)
- Jvm范例(Java/Kotlin)
- .Net范例(C#)
- Android范例
- 网页版范例
- API版
- 版面结构化-RapidStructure
- 衍生项目
- 垂直项目
- RapidOCRPDF:解析PDF文件
- RapidVideOCR:基于RapidOCR,提取视频中的硬字幕
- LGPMA_Infer: 表格结构还原 | 博客解读论文和源码
- 文档图像矫正-PaperEdge | Demo
- 图像文字擦除-CTRNet | Demo
- 模型相关
- 常见问题 FAQ
评论