PDF智能文件差异


9

我有一个LibreOffice文档,我有时会使用内置功能将其转换为PDF。PDF上的时间戳晚于文字处理文档上的时间戳,因此这是有道理的,但是我不能绝对确定文字处理文档会完全生成该PDF。该文档长20页,因此手动检查不是一个好主意。

一种可能性是在另一个文件夹中重做PDF,然后对两个PDF进行二进制比较。不幸的是,命令行diff指示“二进制文件不同”。

是否有一个“智能二进制差异”可以帮助我确定差异仅仅是元数据还是某些非结果差异?

Answers:


13

通常,检查命令和文件扩展名是否是您的期望是一个好主意。diff + pdf结果为diffpdf

sudo apt-get install diffpdf

DiffPDF用于比较两个PDF文件。默认情况下,比较是针对每对页面上的文本,但是也支持比较页面的外观(例如,如果更改了图表或重新格式化了段落)。也可以比较特定的页面或页面范围。例如,如果有两个版本的PDF文件,一个版本的页面为1-12,另一个版本的页面为1-13,因为已将一个额外的页面添加为页面4,则可以通过指定两个页面范围来比较它们,即1第一个为-12,第二个为1-3,第5-13个。这将使DiffPDF将(1、1,),(2、2),(3、3),(4、5),(5、6)等对中的页面比较到(12、13)。

在此处输入图片说明

资料来源:Ubuntugeek.com

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.