如何将.pdf文件转换为图像文件夹?


16

我有一些.pdf文件,我想将其转换为.cbr或.cbz的首选阅读格式,或者,如果不能直接这样做,则需要从.pdf中提取所有页面作为图像,然后将其压缩为我选择的格式。我只能使用Document Viewer一次保存一页。显然,我想更快一点。我尝试了pdfsam,pdf shuffler和pdfmod,但都没有碰到运气。我正在使用Ubuntu 11.10。

Answers:


14

好的,我做了一些进一步的研究,尽管tohuwawohu的方法确实可行,但我发现使用pdftoppm程序更容易实现我想要的工作。由于使用命令行应用程序时我几乎是一个门外汉,因此,我将尽我最大的努力来说明如何使它对我有用。

  1. 导航到包含要编辑的.pdf的文件夹,然后在其中打开终端。我通过使用示例命令来做到这一点:

    cd ~/Documents/PDF
    
  2. 假设我要编辑的文件称为Sample.pdf,我要做的就是使用pdftoppm创建.pdf每页的图像文件。可以选择几种格式(请参见上面的手册页链接),但我更喜欢使用.png。基本命令如下所示:

    pdftoppm -FORMAT FILENAME.pdf PREFIX
    

    或在上面的示例中:

    pdftoppm -png Sample.pdf Sample
    

    此命令在与原始.pdf文件相同的文件夹中创建每个页面的图像文件,其名称类似于Sample-01.png,Sample-02.png等。我已经成功尝试了.png和.jpeg扩展名。.jpg显然不受支持。

  3. 然后,我通过选择所有新创建的图像文件,右键单击并从上下文菜单中选择“压缩”来使用存档管理器。然后,选择我喜欢的存档格式(在本例中为.cbz或Comic Book Zip)并创建新的存档。

  4. 现在,我有了一个名为Sample.cbz的新的.cbz新文件,然后可以使用我的Comix阅读器进行查看!

希望我上面发布的内容足够有意义,以便其他人可以从中学到东西。如果我需要以任何方式进行更改,请告诉我。


非常好!pdftoppm实际上,它似乎比ImageMagick的更容易使用convert
tohuwawohu 2011年

是的,它非常有帮助和容易。我只是想知道。可以添加字母前缀。像前缀a,前缀b,前缀c这样,
Pankaj Badukale 2015年

pdftoppm非常慢,并且占用了我计算机上的所有RAM。pdfimages -j工作得更好。
埃里克·杜米尼尔

4

我对* .cbr / * .cbz不太熟悉,但是看来您必须结合两个步骤:

  1. 将PDF转换为图像
  2. 将它们压缩成ZIP / RAR存档。

关于步骤1,您可以使用ImageMagickconvert命令。您可以提供convert包含多个页面的PDf,并且convert每个页面作为单个图形文件返回。我已经用400 dpi扫描的文本对它进行了测试,以下命令生成了不错的单个JPGE:

$ convert -verbose -colorspace RGB -interlace none -density 400 -quality 100 yourPdfFile.pdf 00%d.jpeg

(有关-quality选项的积分:此论坛条目

结果,您得到000.jpeg001.jpeg依此类推。只需将它们压缩到一个.cbz文件中,就可以完成。

您甚至可以通过“连接”它们来组合这两个步骤:

$ convert -verbose -colorspace RGB -interlace none -density 400 -quality 100 yourPdfFile.pdf 00%d.jpg && zip -vm comic.cbz *.jpg

(请确保当前工作目录中没有其他JPEG,因为使用上面的代码,zip会将所有 JPEG移到cbz文件中)


4

我已经为此目的编写了一个简单的bash脚本,您将需要安装poppler,因此:

sudo apt-get install poppler-utils #ubuntu
brew install poppler # mac

这是bash脚本(另存为convert_to_cbz.sh):

filename="${1%.*}"
echo "Converting $filename to cbz"
mkdir "./$filename"
pdftoppm -jpeg "$1" "./$filename/000"
zip -r9 "${filename}.cbz" "./$filename" 
rm -rf "./$filename"

要使用bash脚本:

chmod +x convert_to_cbz.sh
./convert_to_cbz.sh "Nintendo Official Magazine 066 (OldGameMags).pdf"

希望这对某人有用!


太好了,谢谢。不过我不得不更改脚本。pdftoppm用尽了我所有的RAM,并使计算机崩溃了。用替换第4行pdfimages -j "$1" "./$filename/000" 就可以了。它工作正常,速度很快,似乎没有任何质量损失,并且cbz略小于原始pdf。pdfimages也包含在中poppler-utils
埃里克·杜米尼尔

3

尝试使用口径将.pdf直接转换为.cbr或.cbz。


感谢您的建议,但对我来说,使用Calibre作为解决方案是行不通的。我安装了该程序,很遗憾地说它在我的桌面上像拇指一样伸出来!另外,我发现使用下面的pdftoppm命令比转换之前安装和配置Caliber更快。
肖恩

@Shawn是的,我会说Calibre丑陋且缓慢,但确实可以完成工作。不过,很高兴您找到了更好的解决方案:)
bntser 2011年

1

似乎最简单的方法是使用Acrobat Pro。

  1. 在Acrobat Pro中打开PDf。
  2. 一旦文件被打开,进入File→交通Export→交通Image→交通JPEG,将每个页面导出为一个单一的JPG。
  3. 将所有JPG放在一个文件夹中
  4. 压缩文件夹。
  5. 手动将压缩文件末尾的扩展名从.zip更改为.cbz

如果您喜欢CBR文件,请将该文件夹rar而不是zip压缩,然后将扩展名从.rar更改为.cbr

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.