Tika 解析大文件时该如何处理

learn_more 发布于 2015/05/26 20:58
阅读 377
收藏 1

本人刚刚学习Tika,发现只要稍微大点的文件,基本上就没戏了,

要么就是

内存溢出 Out of Memory

要么就是:

Exception : Unable to process: document is encrypted

我的文件就是一个100M的txt文档,或者一个格式混乱的15MDOC文档,关于Tika处理这种大文件,你们有什么好建议!

加载中
返回顶部
顶部