后来搜索到一个开源项目,正是我所需要的:JODConverter,项目主页在这里:https://code.google.com/p/jodconverter/ 很遗憾的是,此项目作者在2011年11月份就声明停止了对此项目的维护。先下载下来此项目的文件,果然能够顺利转换格式。
1 简介
JODConverter是一个使用OpenOffice.org或者LibreOffice,自动转换文件格式的工具,支持的格式有 PDF, RTF, HTML, Word, Excel, PowerPoint, 和Flash。JODConverter可以用作Java库,或者命令行工具,或者web应用。
2 基本用法:
下载项目主页上的二进制包,解压,即可在命令行中运行:
java -jar lib/jodconverter-core-3.0-beta-4.jar test.doc test.pdf可以把test.doc文件,转换为pdf。
在Linux下转换如果转后出现了乱码,是因为缺少了相应的字体,安装相应的字体即可。http://riches.blog.51cto.com/1167414/394610
3 文档
这里有关于JODConverter的详细文档,不过此文档是JODConverter 2.x的,但是通过此文档可以详细了解JODConverter的作用。
最准确的文档还是要参考官网:https://code.google.com/p/jodconverter/wiki/GettingStarted 和
https://code.google.com/p/jodconverter/wiki/BuildingFromSource
4 自己编译源码,运行jodconverter-sample-webapp
按照官网的提示:使用Maven编译jodconverter-core源码,但是webapp怎么编译,并没有写,从这个提问中我们可以找到答案:https://groups.google.com/group/jodconverter/browse_thread/thread/fab586c38a2f5b24。最后编译得到的.war文件,即可运行web app。
参考网址:
1 http://stackoverflow.com/questions/3022376/how-to-convert-ms-doc-to-pdf
2 http://ihaztehcodez.michael-lloyd-lee.me.uk/2010/10/converting-microsoft-office-word-excel.html
3 https://code.google.com/p/jodconverter/