25
回答
java如何完美解析office,word,excel等文件
极速云服务器,低至1.04元/天>>>   

大家好, 

最新公司项目要实现在线预览word,excel等功能,类似163邮箱的附件预览功能,找了很长时间也就是 POI 解析,但是都是解析为txt 纯文本的信息,有没有谁做过完美解析为html格式的,可以在线预览里面的样式,图片,表格等等??

举报
山哥
发帖于7年前 25回/21K+阅
共有25个答案 最后回答: 1年前

谢谢大家,我根据大家的建议,使用 openoffice + jodconverter 实现将 doc,dox, xls,xlsx, ppt,pptx等转换成 html 预览;

我在RedHat Linux 上安装了 openoffice ,也完全实现了office文档转换成html预览,很是高兴;但是郁闷的是:

在转换ppt为html(或pdf)时,里面的中文有80%-90%是乱码,有部分中文正常显示,乱码的中文变成了韩语(有点像韩语),但是转换doc,xls等中文一切正常,唯独ppt不行;

另外,我在windows上也安装了openoffice,使用 jodconverter 进行转换,ppt等中文全部正常;

是不是Linux上缺少openoffice的一些中文语言包啊? 还是别的? 

补充下:openoffice转换ppt为html时,会生成2种:图片+纯文字的html, 其中生成图片上的汉字是乱码,纯文本Html中的汉字是正常的

--- 共有 1 条评论 ---
java10000我也最近在研究这个jod,但是实验中发现,word转html不能完美转换,其中样式还是丢掉一些,不知道你这边什么情况? 5年前 回复

项目是运行在 Linux 下的, FlexPaper 播放 swf 文件的,

如果使用 Flexpaper 是不是要先将 word, excel等转换成 PDF,然后在使用 swftools 将PDF转换成 swf

疑问:

1. 将 word, excel, ppt 等转换成 PDF 应该使用什么开源的java类库啊?

2. java 如何调用 swftools 在 Linux 上将PDF转换成 swf文件啊?

引用来自#4楼“JSON”的帖子

项目是运行在 Linux 下的, FlexPaper 播放 swf 文件的,

如果使用 Flexpaper 是不是要先将 word, excel等转换成 PDF,然后在使用 swftools 将PDF转换成 swf

疑问:

1. 将 word, excel, ppt 等转换成 PDF 应该使用什么开源的java类库啊?

2. java 如何调用 swftools 在 Linux 上将PDF转换成 swf文件啊?

1. flexpaper的文档中有介绍
2. java可直接调用linux下的命令行工具来执行转换过程,但建议还是后台独立的进程来做此事。

建议你使用原生态语言调用word的“另存为网页”这个功能再做处理。估计你看看officeSDK对你有所帮助。

顶部