合理的HTML自动转换为PDF(在UNIX / Linux环境中)


16

在Linux中,PDF提供与输入文件某种合理程度的相似度,是否有一种方法可以从HTML文件自动生成PDF文档?

与某种交互式GUI相反,命令行工具是关键。

我已经尝试了htmldoc一些相关的表亲。但是这些工具无可救药。 htmldoc根本不支持CSS。你不会找到很多的HTML文档,这些天来没有至少一些 CSS样式。我并不在乎愚蠢的效果或小的修饰,但问题是CSS如今已成为大多数布局的核心。很少有人使用6层嵌套表了。因此,如果转换工具根本不掌握CSS,那么这不仅仅是“文档看起来不太正确”的问题;它可能根本不符合最低可用性标准。

一些人向我建议尝试使用Gecko渲染引擎来生成可转换为PDF的图像,但是我不知道该怎么做,更不用说轻松了。

我毫不犹豫地相信,有很好的商业工具可以做到这一点,但是我真的在寻找一种尽可能开源的软件包,因为这种努力本身就是一种开源并且不付费。

提前致谢!

Answers:


7

您看过wkhtmltopdf吗?无法说出个人效果如何,但似乎正是您所需要的。使用此解决方案以及任何“浏览器自动化”解决方案,唯一的问题是,它将采用打印样式表而不是屏幕显示,因此PDF可能与您在屏幕上看到的不一样。


什么是打印样式表?我一定与CSS领域的最新和最伟大的新事物脱节。
Alex Balashov

这并不是什么新鲜事物,只有大多数网站切换到CSS而不是表格进行布局时,它才变得实用。请尝试alistapart.com/articles/goingtoprintwebcredible.co.uk/user-friendly-resources/css/…进行介绍。
robertc


2

XHTML2PDF是一个Python工具集,它同时包含命令行脚本和Python库(您是否希望将其嵌入到更大的内容中而不用掏空脚本)。它支持HTML / XHTML和CSS,以及其他特定于供应商的CSS样式调整格式化的输出(例如,页码,段落流等)

我只用了一点点就可以批处理一些HTML文档,但是效果很好,而且它的功能集对我来说似乎很全面。该手册隐藏在演示页面上,但它本身就是从HTML文档转换为PDF的一个很好的例子。

我有一组指向“ before”和“ after”示例的链接,但是我只是创建了我的帐户,而且显然,只有垃圾邮件发送者在其第一篇文章中放置了多个链接:-p


1

我想从命令行从HTML页面生成一些PNG。在某个地方,我找到了这个使用mozembed生成屏幕截图的ruby脚本。如果您不希望缩放比例线,则可以删除它。

我看到的唯一问题是该页面实际上在屏幕上出现了一会儿...


嗯是的 最后一部分似乎是一个杀手.。这需要烘焙到纯服务器端后端中。没有显示头或其他任何东西。有什么办法做到这一点?
Alex Balashov

0

尝试使用dompdf,它在de命令行中运行良好,并通过其示例与任何类型的html一起使用


0

PrinceXML。可以处理CSS就好了。提供Linux,Windows,Mac OS X版本。AFAICS,这也是Google Docs PDF输出背后的技术。但请注意:这是付费软件。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.