2
回答
Python PDFminer读取PDF内容速度慢是怎么回事?如何解决?
开发十年,就只剩下这套Java开发体系了   

根据网上的Python读取PDF的相关资料,TZ发现了PDFminer这个Python库,但是当我将其用来读取一个约300MB左右,页数在4000左右的PDF文件时,速度真心感人,一个小时大概读取了2000页,也就是一半的内容,这肯定不是我所预期的样子。时间太太太长了。求Python大佬教教小弟如何优化这个问题。万分感谢

下图为PDFminer读取PDF代码

举报
H__python
发帖于1年前 2回/200阅
顶部