java如何完美解析office,word,excel等文件

山哥 发布于 2010/10/13 12:40
阅读 23K+
收藏 21

大家好, 

最新公司项目要实现在线预览word,excel等功能,类似163邮箱的附件预览功能,找了很长时间也就是 POI 解析,但是都是解析为txt 纯文本的信息,有没有谁做过完美解析为html格式的,可以在线预览里面的样式,图片,表格等等??

加载中
1
山哥
山哥

谢谢大家,我根据大家的建议,使用 openoffice + jodconverter 实现将 doc,dox, xls,xlsx, ppt,pptx等转换成 html 预览;

我在RedHat Linux 上安装了 openoffice ,也完全实现了office文档转换成html预览,很是高兴;但是郁闷的是:

在转换ppt为html(或pdf)时,里面的中文有80%-90%是乱码,有部分中文正常显示,乱码的中文变成了韩语(有点像韩语),但是转换doc,xls等中文一切正常,唯独ppt不行;

另外,我在windows上也安装了openoffice,使用 jodconverter 进行转换,ppt等中文全部正常;

是不是Linux上缺少openoffice的一些中文语言包啊? 还是别的? 

补充下:openoffice转换ppt为html时,会生成2种:图片+纯文字的html, 其中生成图片上的汉字是乱码,纯文本Html中的汉字是正常的

java10000
java10000
我也最近在研究这个jod,但是实验中发现,word转html不能完美转换,其中样式还是丢掉一些,不知道你这边什么情况?
1
孙涛
孙涛

我网上看到一个linux下openOffice下ppt乱码的问题,不知道对你有没有用。

http://ericyuen.blogbus.com/logs/7650496.html

0
吴铁衣
吴铁衣

不考虑使用Office的控件?

0
红薯
红薯

可参考下 FlexPaper 这个在线文档显示组件

http://www.oschina.net/p/flexpaper

0
山哥
山哥

项目是运行在 Linux 下的, FlexPaper 播放 swf 文件的,

如果使用 Flexpaper 是不是要先将 word, excel等转换成 PDF,然后在使用 swftools 将PDF转换成 swf

疑问:

1. 将 word, excel, ppt 等转换成 PDF 应该使用什么开源的java类库啊?

2. java 如何调用 swftools 在 Linux 上将PDF转换成 swf文件啊?

0
红薯
红薯

引用来自#4楼“JSON”的帖子

项目是运行在 Linux 下的, FlexPaper 播放 swf 文件的,

如果使用 Flexpaper 是不是要先将 word, excel等转换成 PDF,然后在使用 swftools 将PDF转换成 swf

疑问:

1. 将 word, excel, ppt 等转换成 PDF 应该使用什么开源的java类库啊?

2. java 如何调用 swftools 在 Linux 上将PDF转换成 swf文件啊?

1. flexpaper的文档中有介绍
2. java可直接调用linux下的命令行工具来执行转换过程,但建议还是后台独立的进程来做此事。

0
阿七

建议你使用原生态语言调用word的“另存为网页”这个功能再做处理。估计你看看officeSDK对你有所帮助。

0
孙涛
孙涛

OpenOffice也可以做的,我觉得你可以找找相关资料。

0
小吕
小吕

open office 可以把 word,excel等office 另存为pdf ,然后把pdf转换成jpg 就可以了 

0
小吕
小吕

使用OpenOffice.org将各类文档转为PDF :http://blog.zhaojie.me/2010/05/convert-document-to-pdf-via-openoffice.html

返回顶部
顶部