为什么Word 2010会创建如此大的PDF文件?


11

我现在才注意到,我的Word 2010(docx)文档只有一页,并且包含一个简单的WMF矢量图形和一些文本,它们的大小接近1 MB。Word文档只有50 kB,使用Bullzip PDF打印机创建的PDF文件大小大约相同。那么,Microsoft如何将其他950 kB写入?

更新:由于最近我一直在获得所有都不适用的答案,因此我希望为您节省工作。使用Windows 7而不是XP(我一年多以前)后,该问题消失了。旧系统似乎不支持某些功能,我怀疑这是某种字体子集。我也无法尝试您的建议,因为该问题不再存在。因此,我无法接受答案。


输出是否匹配?我猜想Word会比Bullzip更贴近PDF格式(通常从来没有听说过)。
拉姆猎犬,2011年

1
这只是在最新的WORD2010更新之后才开始发生。我有WORD2010和Acro Reader 9.5,但是一台计算机没有获得最新的WORD更新。那台计算机将带有图像的DOCX文件重载,并将其DOWN从4 MB转换为3 MB,另一台具有WORD更新的计算机将DOCX从4 MB转换为18MB。我不能使用这么大的文件。不要更新您的WORD程序。

1
似乎Word以非常高分辨率的位图格式导出图像。放大并比较Word和Bullzip生成的PDF并比较质量
tumchaaditya 2014年

1
哦,亲爱的,这很旧。从Windows XP切换到Windows 7后,Word 2010开始制作尺寸更合理的PDF文件。我认为Windows 7具有某些Word所使用的字体子集API,而Windows XP没有,因此它始终包含完整的字体或其他内容。 。
ygoe 2014年

1
我在Windows 7 Pro 64位上使用Word 2013时遇到了同样的问题:我有一个14kB的Word 2013(docx)文件,仅使用默认格式的lorem ipsum文本,当PDFcreator生成22kB PDF文件时,Word会生成90kB PDF。并且它迅速增长,具有某些格式(标题,标题1和2)的同一文件,15kB的Word文件(无图片)将变成230kB的文件,Word的PDF另存为(使用最大压缩率),而使用PDFcreator仅为30kB。我的问题是PDFcreator无法处理链接。
托马斯

Answers:


2

Word 2016仍然存在问题。也许与OP有所不同,但仍然存在:从1页20 KB文档开始,另存为PDF,获得300 KB PDF。

我不能说为什么Word会这样做,但是有一个简单的方法可以缩小这些PDF文件:安装GhostScript,然后运行以下命令:

gswin64c.exe -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dQUIET -dBATCH "-sOutputFile=%2" "%1"

其中%1是输入PDF,%2是输出PDF。将300 KB PDF转换为40 KB PDF。仍然不像CutePDF那样小(一个相同的文档可以管理大约30 KB),但是有了很大的改进。

或者只是跳过此步骤并直接打印到CutePDF。


1
请参阅Arjan对Jakke答案的评论。
fixer1234 '16

备份答案。cutePDF代替了670k,创建了170k文件。
szako'5

1

很多原因。

  1. XML样式
  2. 图像转换为base64,33%比原始图像大
  3. 其他东西,例如字体等...
  4. 很多东西似乎什么都没做!

1

在Word 2010中检查选项设置。您可能会指示Word将一种或几种完整字体嵌入到文档中。这会导致文档严重膨胀,尤其是在使用Unicode字体的情况下。如果选中该选项,则取消选中该选项,Word将仅嵌入文档中实际使用的字符。

您还应该知道,*。docx是一种压缩文件格式,必须先对其进行解压缩,然后才能将其转换为会增加其大小的PDF文件。

如果这对您不起作用,则可以通过Adobe和Nuance使用多种PDF优化工具。

希望这可以帮助。


0

思想:Word将矢量图形转换为位图或PNG,并以有限的压缩或没有压缩的方式将其嵌入到文档中。检查PDF设置,看看是否可以调整。

分析:一种检查方法是将Word文件的文件扩展名更改为.ZIP,然后亲自查看Word在做什么!


2
您根本无法调整Word的PDF生成。您只能从“普通”和“网络”质量中进行选择,但这仅产生了几kB的差异。我必须检查矢量到像素的转换,这在非常高的缩放系数下应该可见。
ygoe 2011年

3
奇怪,当我放大PDF文档时,我在很短的时间内看到光栅化的文本和图形。它看起来像Word窗口的屏幕截图,包括低分辨率的ClearType平滑文本。此后,内容将替换为图形和文本的高分辨率矢量图。我如何查看PDF文档以了解内部是否有可以删除的隐藏像素图像?
ygoe 2011年

我也不认为这是原因。我注意到文档不包含图片的情况也很严重。
2012年

@LonelyPixel:在缩放这可能需要一段时间你的PDF阅读器重新渲染内容..
tumchaaditya

0

这是因为PDF文档的格式将包含(可能)每个字符的样式。我做了类似的事情,但对HTML进行了处理,它生成了一个20KB的html文件作为600KB的文件。


0

使用专门用于特定目的的软件。Word可以很好地创建Word文档,并且由于许多其他软件都可以添加该功能,因此MS不能将其遗漏。我真的不明白他们为什么会选择花费大量时间和精力来优化大多数人甚至不使用或不在乎的东西。关心的人不要在Word打印中使用word。

您应该考虑在计算机上安装专用的PDF打印机,然后使用PRINT函数创建PDF文件。有许多免费的和商业的软件包可以很好地完成工作,并将您的PDF文件压缩到最小。

问为什么Word会创建这么大的PDF文件,您最好在他们的论坛上向MS工程师询问……只有他们才能知道。在这里,您将对MS为什么以他们的方式做事有很多猜测。


1
我非常喜欢内置的PDF导出功能,因为它保留了可单击的内容表或嵌入式URL等。(因此,OpenOffice中的导出效果很好。)如果OS提供的话,某些软件可能与PDF打印选项兼容。就像OS X中的某些浏览器一样,内置PDF打印也可以完美地工作
2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.