java读取word目录结构

勤奋的码农 发布于 2013/07/15 16:06
阅读 3K+
收藏 2
最近项目中有个读取word文档的需求,需要把word文档中的目录结构及目录下的内容读取出来存到数据库中,poi需要能实现相关功能,但是需要自己解析文档结构,而且对2003的支持也不是很好,想问下有没有现成的类库,可以直接拿到word的文档目录结构,及每个标题的内容,收费的也可以,请大家帮帮忙,谢谢……
加载中
0
ZouLin
ZouLin
POI好像实现不了,如果是Word XML可式的文件格式,用Java自己解析就可以了。二进制的DOC目前无解。
ZouLin
ZouLin
@勤奋的码农 jacob试过吗,不过MS很久没有更新过了。
勤奋的码农
POI到是可以自己通过解析实现,但是想找个现成的,不知道有没有,收费的也可以
0
平原君
平原君

POI不可以么?好吧,POI没用过,不是十分清楚。

不过doc不是无解的,有解析doc的库,不过是C#的,java的还没有看到。

那就只好用大招了,一个是自己解析(微软有doc格式说明),一个是用libreoffice的sdk或源码

0
JerryLin
JerryLin

Aspose.Words for Java

0
guor
guor
我用POI解析过啊,可以拿到目录结构的,只不过我只是用word 2003跑了
0
Monkey
Monkey
windows平台直接借助微软api,其他不知道
0
p
pittypan

这有个帖子是关于read Word document 目录结构的,你可以看一下


http://bbs.csdn.net/topics/360073389

http://social.msdn.microsoft.com/Forums/vstudio/zh-CN/6cdc3ab0-1018-4f4c-9793-84b89128d838/cwordtxt?forum=visualcshartzhchs

0
xuanlv886
xuanlv886

 

https://my.oschina.net/u/3410302/blog/3048377

返回顶部
顶部