我有一个包含100个jpg图像的文件夹。我想将这些图像转换成多页pdf文件,其中包含所有图像(裁剪为A4大小)。它们已经处于正确的旋转状态。
我应该使用哪些工具?
我有一个包含100个jpg图像的文件夹。我想将这些图像转换成多页pdf文件,其中包含所有图像(裁剪为A4大小)。它们已经处于正确的旋转状态。
我应该使用哪些工具?
Answers:
要求
图像魔术
键入以下命令以提示输入完整的ImageMagick:
sudo apt-get install imagemagick
从jpeg转换为PDF:
转到工作目录(jpegs目录):
cd work/directory/path
将JPG文件转换为PDF:
convert *.jpg foo.pdf
convert */*.jpg foo.pdf
不幸的是,convert
在此之前更改图像是为了使质量损失最小,即原始质量jpg
,您需要使用img2pdf
,我使用以下命令:
3 1)这样可以pdf
从每张jpg
图像制作文件,而不会降低分辨率或质量:
ls -1 ./*jpg | xargs -L1 -I {} img2pdf {} -o {}.pdf
2)这样可以将pdf
页面串联成一个页面:
pdftk *.pdf cat output combined.pdf
3)最后,我添加了一个OCRed文本层,该层不会更改pdf中扫描的质量,因此可以搜索它们:
pypdfocr combined.pdf
我强烈建议使用Python CLI程序img2pdf
进行无损转换:
https://gitlab.mister-muffin.de/josch/img2pdf
用法示例:
img2pdf img1.png img2.jpg -o out.pdf