PDF到文本转换器[关闭]


9

我正在寻找一种“一键式”的方式来获取任何PDF并将其转换为纯文本。理想的是在OSX或Linux上。

理想情况下,该解决方案应包括OCR功能,但不一定需要。

头等大事是无需配置即可使用任何文件。

Answers:


23

有包含二进制文件的xpdfpdftotext

Pdftotext将可移植文档格式(PDF)文件转换为纯文本。

在Linux上有可用的安装程序。似乎它也包含在poppler-utils包装中。在OS X上,您可以使用Homebrew(首先安装)进行安装,然后使用

brew install homebrew/x11/xpdf

它将下载源文件并针对OS X进行编译。之后,只需使用它即可:

pdftotext your_pdf_file.pdf

这将生成一个纯文本文件。也有几个选项,请man pdftotext查看更多详细信息。

另一种方法是在OSX中使用poppler

brew install poppler

在Debian和朋友中

apt-get install poppler-utils

从今天开始,命令是brew install homebrew/x11/xpdf
Diego Vieira

1
@DiegoVieira谢谢。下次随时提出修改建议!
slhck

使用poppler代替xpdf / pdftotext有什么优势?
贡萨洛·巴哈蒙德斯

brew install Caskroom/cask/pdftotext
雨果

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.