Python PDFminer读取PDF内容速度慢是怎么回事?如何解决?

H__python 发布于 2017/08/24 17:19
阅读 284
收藏 0

根据网上的Python读取PDF的相关资料,TZ发现了PDFminer这个Python库,但是当我将其用来读取一个约300MB左右,页数在4000左右的PDF文件时,速度真心感人,一个小时大概读取了2000页,也就是一半的内容,这肯定不是我所预期的样子。时间太太太长了。求Python大佬教教小弟如何优化这个问题。万分感谢

下图为PDFminer读取PDF代码

加载中
0
H__python
H__python

在一个月后的今天,把这个问题解决了。换掉了这个三方库,使用的XPD来读取PDF,速度比这个快太多了。

0
mickelfeng
H__python
H__python
谢谢你的回答,请问多核是什么意思呢?多进程读取么?还是?求大佬赐教
返回顶部
顶部