我在pdfbox 转text的时候,转化后的text为什么尾部总有一段没有?

安西都护府首席程序员 发布于 2017/09/06 15:24
阅读 40
收藏 0

我转化后对比 原PDF文件,发现所有的转化后的text文件尾部都差一点。

“ ] 高俊涛. 海洋环境救助报酬多层支付主体解构 [ ] .
中国海洋大学学报( 社会科学版),2016(3) : 56-60.
[ 9 ] 陈小曼. 国际船舶油污责任赔”

这是其中转化后的text的尾部,后面应该还有一段的。

 

我代码是这样写的。

File pdfdir = new File("F:/pagepass/pdf");

		File[] files = pdfdir.listFiles();

		for (int i = 0; i < files.length; i++) {

			try {
				document = PDDocument.load(files[i]);

				pdfTextStripper.writeText(document,
						new FileWriter(new File("F:/pagepass/text/" + files[i].getName() + ".txt")));
				System.out.println(files[i].getName() + "成功");

			} catch (Exception e) {
				// e.printStackTrace();
			}
		}

 

加载中
返回顶部
顶部