Answers:
谢谢大家的回答。在您的帮助下,我能够编译出一系列命令,这些命令可以从几乎所有相关的Office文档中提取页数:
DOCX / PPTX
unzip -p 'sample.docx' docProps/app.xml | grep -oP '(?<=\<Pages\>).*(?=\</Pages\>)'
unzip -p 'sample.pptx' docProps/app.xml | grep -oP '(?<=\<Slides\>).*(?=\</Slides\>)'
注意:unzip
可以安装sudo apt-get install unzip
。
DOC / PPT
wvSummary sample.doc | grep -oP '(?<=of Pages = )[ A-Za-z0-9]*'
wvSummary sample.ppt | grep -oP '(?<=of Slides = )[ A-Za-z0-9]*'
注意:(wvSummary
区分大小写!)是wv
包装的一部分。使用进行安装sudo apt-get install wv
。
ODT
unzip -p sample.odt meta.xml | grep -oP '(?<=page-count=")[ A-Za-z0-9]*'
PDF格式
pdfinfo sample.pdf | grep -oP '(?<=Pages: )[ A-Za-z0-9]*'
注意:pdfinfo
是poppler-utils
Ubuntu的一部分,应预装在Ubuntu上。
DJVU
djvused -e "n" sample.djvu
注意:djvused
是djvulibre-bin
包装的一部分,可能与一起安装sudo apt-get install djvulibre-bin
。
unzip -p document.odt meta.xml | grep -o 'page-count="[0-9]*"'