在预览中保存时,导致PDF文件大小增加的原因是什么?


17

似乎进行编辑,注释或什至只是在Preview中打开并保存PDF文件都会大大增加文件大小。我注意到,对于我扫描过的某些书,这样做也可以缩短页面渲染时间。

谁能阐明导致这些变化的原因?我对在Preview和iPad(也许是GoodReader)之间同步PDF电子书的注释感兴趣,但是对于大型PDF文件来说,这可能太不切实际。


2
这可能是由于他们决定如何在预览中对PDF进行编码。PDF现在是一种开放格式,但这并不一定意味着每个人都以相同的方式对其进行编码。最安全的选择是使用Adobe PDF编辑器并使用它。据这些人介绍,forums.apple.com/thread/3896311?start=0&tstart=0会有所作为。他们还将讨论您问题背后的可能原因。
Tony

Answers:


12

列夫·托尔斯泰(Leo Tolstoy)在他鲜为人知的小说PDF卡列尼娜PDF Karenina)中写道:

最佳编码的PDF文件都是一样的。每个以非最佳方式编码的PDF文件都以其自己的方式进行了非最佳编码。

任何人都很难回答为什么预览修改后您的 PDF文件更大。PDF文件包含许多不同种类的数据:图像,内容流,字体,文档开销,颜色空间,扩展的图形状态和交叉引用表。就像一个句子可能简洁明了,而另一句话却很冗长,但两者都是有效的英语并且说的是同样的话,所以一个PDF文件也可能具有更冗长的方式来表示与更简洁的PDF文件相同的内容。我们必须查看您的确切PDF文件。它们可能是由各种不同的软件创建的,有些简洁,有些则更少。

使用哪个版本的Mac OS X和Preview也很重要,因为这决定了在“在预览中另存为”时写入新PDF文件的软件。

但是,我可以告诉您一些我的 PDF文件变得更大了。这个故事适用于运行Mac OS X 10.5.8和Apple Preview 4.2(469.5)的计算机。

一个文件,Giulio.pdf是一个22页的文档,其中文本为文本,而不是扫描的图像。它是461,092字节大。我在“预览”中将其打开,然后执行“ 文件...另存为...”,并将其保存为新文件名。新文件为724,421字节,或大57%。

我使用Mac OS的Adobe Acrobat Professional版本8.3.1打开了每个文件。我做高级... PDF优化...审计空间使用情况......。一个小对话框提供了每个使用类别所导致的字节数的细分,以及该类别文件总大小的百分比。

原始的Giulio.pdf390,754字节(84.75%)用于内容流,零字节用于图像。它是PDF 1.4格式。预览保存的文件有675,846字节(93.29%)用于内容流,图像的字节数也为零,并且为PDF 1.3格式。预览使内容流增加了285,092字节,占两者之间文件大小差异的73%。

我想知道PDF 1.3文件格式在本质上是否不适合存储这种文件。我Giulio.pdf在Adobe Acrobat Professional 8中打开了原始文档,并做了“ 高级... PDF优化程序...”以与Acrobat 3.0和更高版本兼容,然后按“确定”。我将结果文件保存为新名称。生成的文件为PDF 1.3格式,大小为452,356字节,或小于原始文件。它的内容流为375,171字节(占82.94%),比例相似,但小于原始文件的内容流。

因此,我们似乎可以得出结论,Mac OS X 10.5.8上的“预览”应用程序无法在PDF文件中生成简洁的内容流,效率不如其他PDF创建者,而且这种差异足以解决尺寸差异的四分之三。在没有图像的PDF文件中。

我对form k.pdf从纸上扫描的一页纸文档进行了类似的实验。原始文件为303,730字节,其中298,197字节(98.18%)是图像。预览使用“另存为...”创建的此文件的副本为300,601字节,或小1%。该文件大小的差异远远超过了由Preview创建的文件中较小的“文档开销”字节类别。

因此,似乎我们也可以得出结论,预览并不总是导致PDF文件增大。它取决于原始PDF文件的性质以及其开头的简洁程度。


3

我知道这已经很晚了,但是至少在最初使用时,我发现了一些似乎可行的方法:我尝试使用Quartz过滤器“减小文件大小”。它似乎可以工作,但默认情况下未启用。我可以通过“另存为”菜单(保留选项)专门选择它,但是担心它默认为自动保存的常用方法。

这就是我所发生的事情,以及我最初是如何进入此页面的:PDF首先是一本91MB 900页的书。我添加了一个注释并将其保存,文件跃升至2.29GB。最重要的是,它需要永久保存,特别是因为我要保存到外部驱动器。谢天谢地,驱动器是USB 3!

无论如何,有没有提取这些注释?我可以在iPad上的Goodreader和PDF Expert上进行注释和突出显示。如果“预览”不允许我在计算机上执行此操作,是否还有其他应用程序可以?为什么不能只保存注释/突出显示内容,却不尝试重新压缩所有图片,就像我每次都重新保存JPEG一样。谢谢您的帮助!


这有效:400 KiB> 1.3 MiB> 540 KiB。我的原始PDF版本不足400 KiB,并且在添加了几个突出显示/下划线后变成了一个惊人的1.3 MiB。我按照建议进行操作,文件降为540 KiB:另存为...,并且Quartz Filter设置为减小文件大小。我仍然可以编辑以前的突出显示(对于“ 导出为PDF ...”来说这是不可能的),并且其大小与在其他设备上进行编辑所得到的结果更加一致。
丹尼尔(Daniel)

1

这个问题仍然是一个严重的问题。在Preview 7.0(Mac Os 10.9.5。)中,我使用Acrobat 9.5.5生成了pdf。导致文件大小为5 MB。在“预览”中,我恰好添加了12个字符(使用编辑工具)。保存此文件后,它膨胀到14 MB。

您可以通过在Acrobat中再次打开并保存进行修复(可能必须使用“减小文件大小”选项)。


2
这并不能解释问题发生的原因
伊恩·C

0

无法为解决方案添加线索。我可以添加一个类似的场景(OS X 10.11.3):在预览中打开一个重为〜800kb的扫描pdf,删除了几个空白的扫描页面,结果,缩短了两页的pdf为〜2,2Mb。“选项另存为”并选择“减小文件大小”石英过滤器会将文件压缩到... 1,9Mb。

原始文件是由Xerox WC 7830复印机生成的,根据我的经验(与我们之前使用的多功能打印机/复印机相比),可以生成非常优化的扫描pdf。

视觉上看不到文件中的任何差异;我猜想页面图像将以24bpp的速度重新压缩,而原始文件使用的色深要小得多,可能是6位(它是打印并签名的文档,仅是文本,清晰可见,扫描仪可以很好地保持白色背景纯白色)。遗憾的是,Preview不够聪明,无法检测和维护此文件,尽管其余页面未进行任何更改(再次仅删除了几页),但似乎需要重新压缩整个文件。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.