在开始使用Ubuntu之前,我使用Nitro PDF阅读器自动从PDF文件提取图像。有用于Linux的PDF阅读器吗?
我希望能够比拍摄快照时更快/更轻松地提取图像。
在开始使用Ubuntu之前,我使用Nitro PDF阅读器自动从PDF文件提取图像。有用于Linux的PDF阅读器吗?
我希望能够比拍摄快照时更快/更轻松地提取图像。
Answers:
pdfimages
pdfimages
是PDF图像提取工具,可将PDF文件中的图像保存为PPM,PBM,JPEG或JPEG 2000文件格式。
它是poppler-utils
软件包的一部分,您需要安装它。
用法: pdfimages [options] <PDF-file> <image-root>
示例:以下内容从PDF文件中提取所有图像,并将它们保存为JPEG格式。
pdfimages -j in.pdf /tmp/out
将PDF文件in.pdf
中的图像保存在文件中/tmp/out-000.jpg
(或/tmp/out-000.pbm
;请参见下文)/tmp/out-001.jpg
等。
pdfimages 手册页说明:
-j: Normally, all images are written as PBM (for monochrome images) or PPM for
non-monochrome images) files. With this option, images in DCT format are
saved as JPEG files. All non-DCT images are saved in PBM/PPM format as usual.
-all Write JPEG, JPEG2000, JBIG2, and CCITT images in their native format. CMYK files are written as TIFF files. All other images are written as PNG files. This is equivalent to specifying the options -png -tiff -j -jp2 -jbig2 -ccitt.
-all
开关仅在最新的poppler-utils版本中受支持。例如,如果您仍然在12.04,您将无法访问此选项
-all
PNM格式的go。它们是无损的,您可以将图像后处理为例如PNG。
$ pdfimages -list <PDF-file>
检查“ enc”列中的原始格式,因此您不必将图像重新编码为另一种格式。
我经常为此使用Inkscape。加载页面,然后删除所有其他内容。好处是您可以在SVG中获取矢量图像并根据需要对其进行修改。
我有一个双列PDF文件,其中包含用LaTeX创建的嵌入图像,其中原始图像作为EPS提供。我尝试基于提出了建议的解决方案pdfimages
,但是很遗憾,它没有返回任何图像。后来我尝试使用Inkscape,但是它生成的SVG图像失真了,也没有运气将它们导出为EPS。
适用于我们的软件是MasterPdfEditor。
这是程序
结果是非常高质量的,但是该软件不是免费的。有一个演示版,它“允许您尝试所有功能”,但附带“在输出文件上添加水印”。坦率地说,我在生成的PDF中没有发现任何水印。
我使用pdfimages这是一个命令行工具,对我来说非常有用。它非常易于使用,您可以使用--help选项来了解有关其用法的更多信息。我使用Ubuntu,并且已预装。如果您的pdf文件已加密或受密码保护,则可以使用其他选项,因此此工具非常有效。您可以在此处阅读 有关pdfimages的更多信息
如果要使用pdfviewer从pdf裁剪图像,可以尝试okular。它可以裁剪png或jpeg格式的任何内容(文本或图像)。如果要从pdf中提取png格式的图像,则可以使用pdftohtml用最少的命令来完成。它将pdf转换为html加图像。在这里您可以找到一个示例-https://www.youtube.com/watch?v=CG1rf7k3xo8。如果要从pdf中提取许多图像,建议您尝试一下。
使用软件:Xreader OS:Antergos
脚步:
pdfimages
比NitroPDF更好/更差吗?