似乎进行编辑,注释或什至只是在Preview中打开并保存PDF文件都会大大增加文件大小。我注意到,对于我扫描过的某些书,这样做也可以缩短页面渲染时间。
谁能阐明导致这些变化的原因?我对在Preview和iPad(也许是GoodReader)之间同步PDF电子书的注释感兴趣,但是对于大型PDF文件来说,这可能太不切实际。
似乎进行编辑,注释或什至只是在Preview中打开并保存PDF文件都会大大增加文件大小。我注意到,对于我扫描过的某些书,这样做也可以缩短页面渲染时间。
谁能阐明导致这些变化的原因?我对在Preview和iPad(也许是GoodReader)之间同步PDF电子书的注释感兴趣,但是对于大型PDF文件来说,这可能太不切实际。
Answers:
列夫·托尔斯泰(Leo Tolstoy)在他鲜为人知的小说PDF卡列尼娜(PDF Karenina)中写道:
最佳编码的PDF文件都是一样的。每个以非最佳方式编码的PDF文件都以其自己的方式进行了非最佳编码。
任何人都很难回答为什么预览修改后您的 PDF文件更大。PDF文件包含许多不同种类的数据:图像,内容流,字体,文档开销,颜色空间,扩展的图形状态和交叉引用表。就像一个句子可能简洁明了,而另一句话却很冗长,但两者都是有效的英语并且说的是同样的话,所以一个PDF文件也可能具有更冗长的方式来表示与更简洁的PDF文件相同的内容。我们必须查看您的确切PDF文件。它们可能是由各种不同的软件创建的,有些简洁,有些则更少。
使用哪个版本的Mac OS X和Preview也很重要,因为这决定了在“在预览中另存为”时写入新PDF文件的软件。
但是,我可以告诉您一些我的 PDF文件变得更大了。这个故事适用于运行Mac OS X 10.5.8和Apple Preview 4.2(469.5)的计算机。
一个文件,Giulio.pdf
是一个22页的文档,其中文本为文本,而不是扫描的图像。它是461,092字节大。我在“预览”中将其打开,然后执行“ 文件...另存为...”,并将其保存为新文件名。新文件为724,421字节,或大57%。
我使用Mac OS的Adobe Acrobat Professional版本8.3.1打开了每个文件。我做高级... PDF优化...审计空间使用情况......。一个小对话框提供了每个使用类别所导致的字节数的细分,以及该类别文件总大小的百分比。
原始的Giulio.pdf
390,754字节(84.75%)用于内容流,零字节用于图像。它是PDF 1.4格式。预览保存的文件有675,846字节(93.29%)用于内容流,图像的字节数也为零,并且为PDF 1.3格式。预览使内容流增加了285,092字节,占两者之间文件大小差异的73%。
我想知道PDF 1.3文件格式在本质上是否不适合存储这种文件。我Giulio.pdf
在Adobe Acrobat Professional 8中打开了原始文档,并做了“ 高级... PDF优化程序...”以与Acrobat 3.0和更高版本兼容,然后按“确定”。我将结果文件保存为新名称。生成的文件为PDF 1.3格式,大小为452,356字节,或小于原始文件。它的内容流为375,171字节(占82.94%),比例相似,但小于原始文件的内容流。
因此,我们似乎可以得出结论,Mac OS X 10.5.8上的“预览”应用程序无法在PDF文件中生成简洁的内容流,效率不如其他PDF创建者,而且这种差异足以解决尺寸差异的四分之三。在没有图像的PDF文件中。
我对form k.pdf
从纸上扫描的一页纸文档进行了类似的实验。原始文件为303,730字节,其中298,197字节(98.18%)是图像。预览使用“另存为...”创建的此文件的副本为300,601字节,或小1%。该文件大小的差异远远超过了由Preview创建的文件中较小的“文档开销”字节类别。
因此,似乎我们也可以得出结论,预览并不总是导致PDF文件增大。它取决于原始PDF文件的性质以及其开头的简洁程度。
我知道这已经很晚了,但是至少在最初使用时,我发现了一些似乎可行的方法:我尝试使用Quartz过滤器“减小文件大小”。它似乎可以工作,但默认情况下未启用。我可以通过“另存为”菜单(保留选项)专门选择它,但是担心它默认为自动保存的常用方法。
这就是我所发生的事情,以及我最初是如何进入此页面的:PDF首先是一本91MB 900页的书。我添加了一个注释并将其保存,文件跃升至2.29GB。最重要的是,它需要永久保存,特别是因为我要保存到外部驱动器。谢天谢地,驱动器是USB 3!
无论如何,有没有提取这些注释?我可以在iPad上的Goodreader和PDF Expert上进行注释和突出显示。如果“预览”不允许我在计算机上执行此操作,是否还有其他应用程序可以?为什么不能只保存注释/突出显示内容,却不尝试重新压缩所有图片,就像我每次都重新保存JPEG一样。谢谢您的帮助!
无法为解决方案添加线索。我可以添加一个类似的场景(OS X 10.11.3):在预览中打开一个重为〜800kb的扫描pdf,删除了几个空白的扫描页面,结果,缩短了两页的pdf为〜2,2Mb。“选项另存为”并选择“减小文件大小”石英过滤器会将文件压缩到... 1,9Mb。
原始文件是由Xerox WC 7830复印机生成的,根据我的经验(与我们之前使用的多功能打印机/复印机相比),可以生成非常优化的扫描pdf。
视觉上看不到文件中的任何差异;我猜想页面图像将以24bpp的速度重新压缩,而原始文件使用的色深要小得多,可能是6位(它是打印并签名的文档,仅是文本,清晰可见,扫描仪可以很好地保持白色背景纯白色)。遗憾的是,Preview不够聪明,无法检测和维护此文件,尽管其余页面未进行任何更改(再次仅删除了几页),但似乎需要重新压缩整个文件。