基于 JAVA 开发识别PDF和图像文字的小程序

曹勇 发布于 2016/11/07 16:59
阅读 46
收藏 0

本项目的预算为 100000 元,由于众包的机制,审核通过后无法修改项目预算


我们需要你基于 Java 开发一个桌面小程序,实现:

1,识别扫描件(图片)或者pdf的文字(包含表格),并按扫描件和pdf的样式转成 word 文档。

2,识别图片中的手写体签名和盖章(只需要程序给出是否含有手写签名或盖章即可)

3,识别率95%以上,

需要提供源代码,并且源代码版权和使用权归我方所有。

附件是一些样本,可以直接拿来测试和开发之用。

加载中
0
wo2f
wo2f
你要是转换文档,还不如找兼职学生给你打字打出来,如果专门研究OCR,那费用高了,我们有一套dome,可以扫描表格。
0
胡大萝卜
胡大萝卜

引用来自“wo2f”的评论

你要是转换文档,还不如找兼职学生给你打字打出来,如果专门研究OCR,那费用高了,我们有一套dome,可以扫描表格。
他估计想要做的不是OCR,应该就是识别,遇到识别手写字体/盖章图像覆盖的问题了
0
爪哇飞燕
爪哇飞燕
nb,批量全自动识别,人都不要了。
0
曹勇
曹勇

引用来自“wo2f”的评论

你要是转换文档,还不如找兼职学生给你打字打出来,如果专门研究OCR,那费用高了,我们有一套dome,可以扫描表格。

引用来自“胡源”的评论

他估计想要做的不是OCR,应该就是识别,遇到识别手写字体/盖章图像覆盖的问题了
是需要一套软件来批量把扫描的图片或者pdf转换成word
0
曹勇
曹勇

引用来自“wo2f”的评论

你要是转换文档,还不如找兼职学生给你打字打出来,如果专门研究OCR,那费用高了,我们有一套dome,可以扫描表格。
有demo可以演示吗?我需要能识别图片中的文字和表格,转成word文档可编辑
0
胡大萝卜
胡大萝卜

引用来自“wo2f”的评论

你要是转换文档,还不如找兼职学生给你打字打出来,如果专门研究OCR,那费用高了,我们有一套dome,可以扫描表格。

引用来自“胡源”的评论

他估计想要做的不是OCR,应该就是识别,遇到识别手写字体/盖章图像覆盖的问题了

引用来自“曹勇”的评论

是需要一套软件来批量把扫描的图片或者pdf转换成word
你的word有啥要求,里面文字需要能够复制出来?
0
离人
离人
手写字体/盖章图像不好做~
0
boystudio
boystudio
CAJViewer,打印版的识别率达90%以上,网上也有一些工具,识别率很高,但后期还是需要人工校验,之前研究过一些,表格识别率不行,文字很不错。若自动化处理的话,写一些脚本或工具处理就行了。
0
永和
永和

引用来自“离人”的评论

手写字体/盖章图像不好做~
只需要识别有还是无,不需要提取出来
0
s
smf
样本里没有表格 还有个文件不是扫描件
返回顶部
顶部