Answers:
尝试使用Gscan2pdf,您可以从软件中心下载该文件,也可以从命令行进行安装sudo apt-get install gscan2pdf
。
打开Gscan2Pdf:
文件>导入您的PDF文件;
现在您只有一个页面(请参阅左列):
然后工具>清理 ;
选择double作为布局,将#output pages作为2,然后单击OK;
Gscan2pdf拆分了您的文档(除其他外,它还将清理和校正偏移等)。现在您有两页:
您可以使用mutool
,一个MuPDF命令行工具(sudo apt-get install mupdf-tools
):
mutool poster -x 2 input.pdf output.pdf
-y
如果要执行垂直分割,也可以使用。
mupdf-tools
(so .. sudo apt-get install mupdf-tools
)。
mutool clean input.pdf output.pdf 2-N
我会用Briss。它使您可以选择每个页面的各个区域,每个区域都可以变成一个新页面。
另一个选项是ScanTailor。该程序特别适合一次处理多个扫描。
apt-get install scantailor
不幸的是,它仅适用于图像文件输入,但它非常简单,足以将扫描的PDF转换为jpg。这是我用来将整个PDF目录转换为jpg的单线。如果PDF具有n页,则将生成n个 jpg文件。
for f in ./*.pdf; do gs -q -dSAFER -dBATCH -dNOPAUSE -r300 -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -sDEVICE=png16m "-sOutputFile=$f%02d.png" "$f" -c quit; done;
我已经准备好分享截图了,但是我没有足够的代表来发布它们。
ScanTailor输出到tif,因此,如果您希望将文件恢复为PDF,则可以使用它为每一页制作PDF。
for f in ./*.tif; do tiff2pdf "$f" -o "$f".pdf -p letter -F; done;
然后,您可以使用这种单线格式,也可以使用PDFShuffler之类的应用程序将任何或所有文件合并为一个PDF。
gs -q -sPAPERSIZE=letter -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=output.pdf *.pdf
使用ImageMagick的命令行解决方案:
将PDF拆分为单个图像:
convert -density 300 orig.pdf page.png
将每个页面图像分成左右图像:
for file in page-*.png;
do convert "$file" -crop 50%x100% "$file-split.png";
done
将page-###-split-#.png
文件重命名为just 001.png
,002.png
等等:
ls page-*-split-*.png | cat -n |
while read n f; do mv "$f" $(printf "%03d.png" $n); done
再次将生成的页面图像合并为PDF:
convert ls -l [0-9][0-9][0-9].png result.pdf
资料来源:(还包括变体和其他技巧)
裁剪和拆分书籍扫描中的3个命令,此处进行了修改以使用for
循环命令以防止出现内存问题。
答案:ImageMagick:如果您遇到ImageMagick内存限制(我这样做了),则转换将在某些页面后退出。