我希望将.tex文件转换为.odt文件。
您能否提出一个好的分步解决方案?
我希望将.tex文件转换为.odt文件。
您能否提出一个好的分步解决方案?
Answers:
不管你信不信,有复杂的文档和大量的包括包,我得到更好的结果LaTeX2HTML比LaTeX2RTF,Pandoc或TEX4ht程序。
latex2html texfile.tex -split 0 -no_navigation -info "" -address "" -html_version 4.0,unicode
这将生成一个具有相同texfile
名称的文件夹,因此您将能够将生成的HTML转换为ODT:
libreoffice --headless --convert-to odt:"OpenDocument Text Flat XML" texfile/index.html
这将产生一个index.odt
文件。看看这个答案,检查如何使用LibreOffice的转换过滤器。
根据评论讨论进行编辑:
尽管上述方法可行,但令我失望的是,我发现生成可靠的文档的唯一方法是使用Adobe Acrobat Pro上LaTeX的PDF输出。
存储库中有一个工具可将LaTeX更改为openoffice.org的XML格式:tex4ht
TeX4ht是一个高度可配置的基于TeX的创作系统,用于产生超文本。它通过样式文件和后处理器与基于TeX的应用程序进行交互,从而将源文件的处理留给本机TeX编译器进行。因此,TeX4ht通常可以处理基于TeX的系统的功能,尤其是LaTeX的功能。
TeX4ht既可以用于使用TeX / LaTeX输入文件编写HTML,也可以用于(通常)仅需很小的修改即可将现有的TeX输入文件(任何格式)转换为HTML。还可以产生其他各种超文本,包括XML,XHTML,MathML和XML的Openoffice.org格式。
命令行...
latex filename.tex
bibtex filename.aux
mk4ht oolatex filename.tex
应该以openoffice.org/libreoffice兼容文件结尾。
软件包pandoc提供了另一个解决方案
例如,您可以执行以下操作:
pandoc -f latex -t odt -o output.odt input.tex
如果输入文件latin1
像我的tex文件一样被编码,则解决方案是:
iconv -f ISO-8859-1 input.tex | pandoc -f latex -t odt -o output.odt
我报告了部分包装说明:
Pandoc是用于从一种标记格式转换为另一种标记格式的Haskell库,也是使用该库的命令行工具。它可以阅读
- 降价和
- 的子集
- reStructuredText,
- HTML和
- 胶乳
它可以写
- 纯文本,
- 降价,
- reStructuredText,
- HTML,-LaTeX,-ConTeXt,
- RTF,
- DocBook XML,
- OpenDocument XML,
- ODT,
- GNU Texinfo,
- MediaWiki标记,
- EPUB,
- 纺织品,
- groff手册页,
- Emacs组织模式,以及
- 滑或
- S5 HTML幻灯片放映。
如果您安装了tex4ht 软件包,该命令oolatex filename
会将.tex转换为.odt(有关tex4ht的更多信息,请参见此处)。
另一种方法是使用RTF作为中间格式的latex2rtf 软件包。