Answers:
我不知道有什么比使用更好的方法pdftotext
,但是那确实less
很有效。也有其他转换器。也许pdftohtml
和lynx
/ links
/ elinks
/ links2
/ w3m
(文本模式的浏览器)可以“渲染”一些东西更好。
我所能找到的是许多相当棘手的解决方案,其中涉及安装名为pdftohtml
或的工具pdftotext
,然后查看生成的文件。
因此,请确保您所使用的Linux风格具有pdftohtml,然后
pdftohtml ch.01.pdf
其次是
lynx ch.o1.html
(位于http://bassemreda.wordpress.com/2009/03/06/console-pdf-viewer/)
谷歌搜索console pdf viewer
仅返回指出没有控制台pdf查看器的页面,您最好的选择是将其转换为html(如上)以保留格式或从中提取文本。