如何将.epub文件转换为纯文本?


32

我可以在okular中查看epub文件,选择所有文本并将其复制粘贴到文本编辑器中。我想要一个命令行方法-有人知道这样的事情吗?


我建议您使用一些Firefox的epub阅读扩展而不是okular。
Adobe

Answers:


40

我不知道Caliber是否值得为您的工作安装,但是如果您有,可以使用功能强大的电子书转换器:

ebook-convert input.epub output.txt

输出格式从输出文件扩展名中扣除

我想可能会有一些XML工具/脚本(XSLT)可以转换文本中的epub,因为epub基本上是ZIP存档中的XHTML


1
口径(它是“电子书转换”)确实是非常强大的工具!谢谢!
drevicko'2

如果您在OS X上安装了口径,则可以在以下位置找到命令行工具:/Applications/calibre.app/Contents/MacOS/ebook-convert
funroll 2016年

如果使用命令行工具,则可能必须配置或设置选项才能获得正确的输出,或者例如在从epub转换为纯文本时可能会得到错误的编码。使用应用程序界面,默认设置似乎可以正常工作。
lacostenycoder

6

另外一种方法是Kevin Boone的epub2txt,可在Github上找到

epub2html是一个简单的命令行实用程序,用于从EPUB文档中提取文本,并且可以选择对其进行重排以适合特定列数的文本显示。它完全用ANSI标准C编写。

用法示例:

epub2txt input.epub > output.txt


2

MuPDF可以从转换epubhtmltxt。要安装它:

sudo apt install mupdf mupdf-tools

要使用它:

mutool convert -o somefilename.txt somefilename.epub 

它假定txt-o选项的输出。

请参阅mutool convert 文档以获取更多信息。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.