将PDF页面一分为二

36

我有一个PDF文件，这是一本书扫描的结果。

在此文件中，该书的2页对应于PDF中的1页。因此，当我在PDF文件中看到一页时，实际上是在看这本书的2页。

在此处输入图片说明

（原始）

我想知道是否有任何方法可以将此文件转换为另一PDF，其中书的一页对应于PDF的一页，即正常情况。

pdf

— 吉诺格
source

27

尝试使用Gscan2pdf，您可以从软件中心下载该文件，也可以从命令行进行安装sudo apt-get install gscan2pdf。

打开Gscan2Pdf：

文件>导入您的PDF文件；

现在您只有一个页面（请参阅左列）：
然后工具>清理 ;
选择double作为布局，将#output pages作为2，然后单击OK；
Gscan2pdf拆分了您的文档（除其他外，它还将清理和校正偏移等）。现在您有两页：
如果对结果满意，请保存PDF文件。

— 本杰明
source

我一直在寻找一种更简便的方法来使用unpaper，而不必生成ppm文件，仅此而已。很有帮助的答案。

— 做

7

对于将来的读者：使用非图像PDF不能满足您的需要-仅导入图像。gscan2pdf看起来非常适合扫描，但:)。

— Andrew Aylett

32

您可以使用mutool，一个MuPDF命令行工具（sudo apt-get install mupdf-tools）：

mutool poster -x 2 input.pdf output.pdf

-y如果要执行垂直分割，也可以使用。

— 佩克
source

5

在Ubuntu 16.04中，软件包名称为mupdf-tools（so .. sudo apt-get install mupdf-tools）。

— franzlorenzon

我以前没有意识到的超级有用的软件包。谢谢！

— 戴

1

工作做得非常好而且很快吗！不幸的是，我找不到使用它从输出PDF中删除第一个空白页面的方法。

— Martin Scharrer

@MartinScharrermutool clean input.pdf output.pdf 2-N

— Peque

12

我会用Briss。它使您可以选择每个页面的各个区域，每个区域都可以变成一个新页面。

在此处输入图片说明

— 松脆的
source

1

我接受了本杰明（而不是您的）的回答，仅仅是因为Briss还不成熟。我尝试过Briss，看起来不错。但是gscan2pdf的安装更快，更清洁。无论如何，谢谢您的贡献！

— JGNog 2011年

1

我已经使用Briss一年多了。在我看来似乎相当成熟。

— frabjous 2011年

这真棒

— user2413

2

另一个选项是ScanTailor。该程序特别适合一次处理多个扫描。

apt-get install scantailor

不幸的是，它仅适用于图像文件输入，但它非常简单，足以将扫描的PDF转换为jpg。这是我用来将整个PDF目录转换为jpg的单线。如果PDF具有n页，则将生成n个 jpg文件。

for f in ./*.pdf; do gs -q -dSAFER -dBATCH -dNOPAUSE -r300 -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -sDEVICE=png16m "-sOutputFile=$f%02d.png" "$f" -c quit; done;

我已经准备好分享截图了，但是我没有足够的代表来发布它们。

ScanTailor输出到tif，因此，如果您希望将文件恢复为PDF，则可以使用它为每一页制作PDF。

for f in ./*.tif; do tiff2pdf "$f" -o "$f".pdf -p letter -F; done;

然后，您可以使用这种单线格式，也可以使用PDFShuffler之类的应用程序将任何或所有文件合并为一个PDF。

gs -q -sPAPERSIZE=letter -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=output.pdf *.pdf

— 柯蒂斯
source

1

这是一个Python脚本。

https://gist.github.com/tshrinivasan/23d8e4986cbae49b8a8c

— 曲尼伐桑
source

0

Sejda可以使用其Web界面或命令行界面（开源）来完成此任务。该任务称为splitdownthemiddle

— 安德里亚·瓦孔迪奥（Andrea Vacondio）
source

0

您可以使用okular或任何pdf阅读器，然后使用打印文件并选择选项，然后复制->页面。选择您感兴趣的页面，然后进行打印。它将剪切所选的页面。简单容易！

— 骑士71
source

0

使用ImageMagick的命令行解决方案：

将PDF拆分为单个图像：
```
convert -density 300 orig.pdf page.png
```

将每个页面图像分成左右图像：

for file in page-*.png;
  do convert "$file" -crop 50%x100% "$file-split.png";
done

将page-###-split-#.png文件重命名为just 001.png，002.png等等：

ls page-*-split-*.png | cat -n | 
  while read n f; do mv "$f" $(printf "%03d.png" $n); done

再次将生成的页面图像合并为PDF：

convert ls -l [0-9][0-9][0-9].png result.pdf

资料来源：（还包括变体和其他技巧）

裁剪和拆分书籍扫描中的3个命令，此处进行了修改以使用for循环命令以防止出现内存问题。
答案：将文件夹中的文件重命名为序号以及此注释
答案：ImageMagick：如果您遇到ImageMagick内存限制（我这样做了），则转换将在某些页面后退出。

— 塔努斯
source

-2

有一个很棒的程序scankromsator。它是免费的，并且可以通过葡萄酒很好地工作。更多信息这里。

— 规律
source