Answers:
佳能扫描仪附带一个名为CanoScan Toolbox的工具。它可以生成多页PDF文件。
VueScan是我想到的一种工具的名称。它与所有扫描仪都不兼容(支持大多数扫描仪;此处为兼容性列表;对于Windows,支持WIA扫描仪)。不幸的是不是免费的。但是它具有“扫描到多页PDF文件 ”功能。
显然(我没有尝试),Scan2PDF是免费的并且可以做到。
在我看来,完成这项工作的最佳方法不是使用图形用户界面程序,而是使用bash脚本集合(例如在Unix / Linux环境中),因此,如果您具有一些编程的基本知识,便可以做GUI程序可以提供给您的更多功能。
您可以先安装一个最小的Unix之类的命令行,然后使用
我更喜欢Cygwin,因为它包含大量的软件包。
如果要从PDF提取图像,请安装pdfimages pdfimages,这是一个开源命令行实用程序,用于从PDF文件提取图像。它可作为poppler-utils和xpdf-utils的一部分免费提供,并且默认情况下包含在许多Linux发行版中。
$ pdfimages file.pdf foo
这种用法将产生一系列带有“ foo”作为前缀的编号图像。
实际上使用$ mkdir temp $ mkdir temp / jpg
在临时目录中创建一个名为jpg的临时文件夹
$ pdfimages -j file.pdf temp/jpg/foo
假设您现在在temp文件夹中有几个fooXXXX.jpg图像。
就您而言,您曾经有fooXXXX.jpg图片。
您现在可以使用convert生成一个PDF(ImageMagick的命令行)
因此,请下载ImageMagick http://www.imagemagick.org/或使用Cygwin软件包管理器进行安装
查看转换文档(在您喜欢的搜索引擎中输入“ ImageMagick convert”)
因此,您了解到要将图片转换为一个PDF文件,您必须编写
$ convert -compress jpeg temp/*.jpg my_output_file.pdf
就这些... ;-),但是此解决方案可以扩展...
让我们想象一下,扫描的图片来自一本书...实际上,一文件是您书的2页...
因此,如果您有10个文件...您的书有20页...而您希望PDF也有20页。
因此,您需要将一个文件中包含的图像拆分为每个页面2个文件。
假设您的文件是temp / foo0001.jpg,您将有2个文件temp2 / foo0001a.jpg(左页)和temp2 / foo0001b.jpg(右页)
创建temp2目录(分割后的文件将进入的目录)
$ mkdir temp2
$ mkdir temp2/jpg
使用文本编辑器(Emacs,VI或如果您喜欢Windows应用程序,则可以使用Notepad或Notepad ++)创建一个名为split_jpg_minw.sh的文件。
minimal_width=1500
minimal_width_ignore=10
rm temp2/jpg/*.jpg
for f in temp/jpg/*.jpg
do
f2=$(basename $f)
read -r width height <<< $( convert $f -format "%w %h" info:)
width2=$(( ${width} / 2 ))
height2=${height}
if [ $width -gt $minimal_width ]; then
echo "split $f ${width}x${height} to 2 files ${width2}x${height2}"
convert $f -crop ${width2}x${height2}+0+0 +repage temp2/jpg/${f2%%.*}a.jpg
convert $f -crop ${width2}x${height2}+$width2+0 +repage temp2/jpg/${f2%%.*}b.jpg
else
if [ $width -gt $minimal_width_ignore ]; then # ignore if with < 10px
echo "copy $f ${width}x${height} (don't split because width<$minimal_width)"
cp $f temp2/jpg/$f2
else
echo "ignore $f ${width}x${height} width=$width<minimal_width_ignore=$minimal_width_ignore"
fi
fi
do
width = 1500px是分割文件(或不分割)的限制
使此脚本可执行
$ chmod +x split_jpg_minw.sh
(您可以使用Tab键自动完成文件名)
运行脚本
$ ./split_jpg_minw.sh
分割的文件将在temp2 / jpg文件夹中
生成新的“拆分”文件。
$ convert -compress jpeg temp2/*.jpg my_output_file_splitted.pdf
您可以在链中添加更多选项,以使用bash脚本生成PDF文件。
没有限制...您只需要学习脚本(但是某些代码示例有时比书籍有用)
例如,您可以使用命令行工具(例如G'MIC)在生成PDF文件之前对图片应用滤镜(以去除例如莫尔图案或减少噪音)
如果找到满意的软件,并且可以扫描为Microsoft Office文件格式(例如.DOC),则可以使用OpenOffice.org(免费)将.DOC文件转换为.PDF文件。
我的建议:
PDFill PDF Tools-一个免费的PDF工具箱,用于合并,拆分,重新排序,加密,解密,旋转,裁剪,重新格式化,页眉,页脚,水印,图像到PDF,PDF到图像,表单域删除/平整/列表,PostScript到PDF ,PDF信息,扫描到PDF以及创建透明图像。
界面有点混乱,但是软件非常出色,如果您要处理大量PDF,则必须具备。
CutePDF Professional具有带有多页设置的“扫描到PDF”功能。它还可以通过将扫描的页面附加到现有的PDF来恢复多页扫描。