Answers:
您可以使用Inkscape,它是一个免费的,开放源代码和跨平台的矢量图形应用程序。它将允许您导入PDF文件并选择嵌入的矢量。然后,您可以编辑它们并根据需要进行处理。
有关详细文档,请访问Inkscape网站。
请注意,在Linux上,它需要X11。还有本机Windows版本。
或者,您可能想要试用Adobe Illustrator(付费软件)。
尽管Inkscape是一种很棒的方法,但对于缺少X11的用户,您也可以在命令行上使用poppler-utils将PDF的各个页面提取为SVG格式。例如,仅提取第30页:
$ pdftocairo -f 30 -l 30 -svg somehugemanual.pdf myextractedpage.svg
然后,您可以使用自己喜欢的矢量编辑器(我的是Inkscape)将图像与文本隔离。
或者,如果您是硬核命令行用户,则可以提取到EPS(封装的脚本)并用于sed
隐藏所有文本(恰好在pdftocairo的BT和ET行之间)。这是如何做:
$ pdftocairo -f 30 -l 30 -eps manual.pdf - | sed '/^BT$/,/^ET$/ d' > myimage.eps
而且,如果您真的很想避免使用X11,甚至可以使用Ghostscript的eps2eps
命令从命令行缩小图像的边框:
$ eps2eps myimage.eps myimage-bb.eps
我已经测试过了,效果很好。但是,就我个人而言,我发现仅使用Inkscape更容易。
cat foo.eps | sed '/^8 dict dup begin$/,/^Q$/ c Q' > nobitmaps.eps