Answers:
我发现此工具看起来像是可以用来识别PDF / A文件的工具。它称为DROID(数字记录和对象识别)。它基于Java,可以从GUI或命令行运行。
摘抄
DROID是国家档案局开发的一种软件工具,用于自动识别文件格式。DROID由其数字保存部门开发,是其更广泛的数字保存活动的一部分,旨在满足任何数字存储库的基本要求,使其能够识别所有存储的数字对象的精确格式,并将该标识链接到中央注册表有关该格式及其依赖项的技术信息。
鉴于它是由国家档案馆赞助的,鉴于PDF / A格式的预期目的,我认为它是执行此操作的正确工具。该项目也是开源的,代码可以在Github上获得,也可以从National Archives网站以二进制格式打包。
如果您正在寻找执行验证和转换的工具,我相信PDFBox可以做到。PDFBox在其网站的首页上列出了PDF / A验证。这是另一个Java应用程序8-)。
网站摘录
PDF / A验证
根据PDF / A ISO标准验证PDF。
在其主页左侧的命令行工具部分下,显示该工具的以下用法:
$ java -jar pdfbox-app-x.y.z.jar org.apache.pdfbox.ConvertColorspace [OPTIONS] <inputfile> <outputfile>
veraPDF是另一个能够验证PDF / A的工具;它是开放保护基金会参考工具集的一部分。它也是一个Java应用程序。
对于仅进行转换,我从标题为:将现有PDF转换为PDF / A的免费方法的博客文章中找到了这种方法,该方法使用以下工具:
完成上述操作后,您将使用以下命令:
$ gs -sDEVICE=pdfwrite -q -dNOPAUSE -dBATCH -dNOSAFER \
-dPDFA -dUseCIEColor -sProcessColorModel=DeviceCMYK \
-sOutputFile=Out_PDFA.pdf PDFA_def.ps pdfmarks IN_PDF.pdf
并非没有疣。本文讨论了其中之一,并修复了其中之一的超链接上的打印标志。本文提供了一个Java应用程序,可以用来修复这些问题:
$ java FixPrintFlag Out_PDFA.pdf New_verifiablePDFA.pdf
它不漂亮,但似乎可行。请参阅文章以获取更多详细信息。
pdfmarks
啊
这是一个bash命令行脚本,它就是这样做的:
#!/bin/bash
pdf_input=$1
ps_output=${pdf_input%.*}.ps
pdfa_output=${pdf_input%.*}_a.pdf
pdftops $input $ps_output
gs -dPDFA -dBATCH -dNOPAUSE -dNOOUTERSAVE -dUseCIEColor -sProcessColorModel=DeviceCMYK -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=$pdfa_output $ps_output
将其保存在路径中名为pdf2pdfa.sh的文件中,然后按以下方式调用它:
pdf2pdfa.sh输入.pdf
它将创建input_a.pdf。
input
?我明白了pdf_input
,那是input
什么?(3)除非有充分的理由不这样做,否则应始终引用shell变量,并且确定自己知道自己在做什么。请不要在评论中回复;编辑 您的答案,使其更清晰,更完整。