从HTML书创建pdf


16

有一些网站将书籍作为HTML页面提供(例如法律资料)。

我可以根据现有结构从这些页面创建PDF书籍吗?

在Windows中,有Adobe Professional(商业软件)。我猜Linux有免费的东西吗?一个涉及脚本的解决方案对我来说可以。

Answers:


9

口径是一个非常强大的工具,可以将事物转换成各种格式的电子书。在您附近的软件中心有售!

不要被它不那么漂亮的UI所欺骗,它可以做很多事情。


1
口径还带有命令行工具ebook-convert。因此,您可以执行此操作for file in *.html ; do ebook-convert "$file" "${file%.html}.pdf" ; done,它将文件夹中的所有html文件转换为PDF。
frabjous

1
这是一个很好的工具,我也是Calibre用户,我认为最新的工具在UI方面有了明显的改进。
Sabacon

4

最简单的方法?从浏览器中选择文件>打印。选择“ 打印到文件”作为打印机,它将询问您想要的位置。确保标记PDF。点击“打印”,它将实际保存到驱动器中,而不是实际打印。


谢谢。但是,有很多文件。这种操作实际上是不可能的。
Lucian Sasu 2010年

4

Htmldoc可能有用,请在此处查看;http://www.htmldoc.org/可以从软件中心获得,可悲的是1.8版本的unicode编码文件有问题,但是在许多情况下它仍然是一个救星,该问题已在1.9开发版本中解决。

我通常在这里使用精彩的剪贴簿扩展名;http://amb.vis.ne.jp/mozilla/scrapbook/以便Firefox捕获网页,如果需要,使用剪贴簿中的编辑工具对其进行修复,然后使用htmldoc将所有页面转换为PDF。



3

我建议使用OpenOffice / LibreOffice创建PDF。作为测试,我下载了Wget手册(全部一页),然后在OponOffice中打开HTML页面,然后单击“直接导出为PDF”按钮。它使用目录中的索引创建了PDF。

过去,我发现这是将HTML页面转换为PDF的最简单方法。它还使您可以轻松进行更改。

屏幕截图:

  • 使用Open Office将Wget手册导出到PDF 使用Open Office将Wget手册导出到PDF

  • 在Open Office中直接导出为PDF选项 在Open Office中直接导出为PDF选项


如果书不在一页中,而是分成多个小节/小节,有什么想法吗?
CiprianTomoiagă17年

2

实际上,我已对口径解决方案投了赞成票。但是,您可以尝试另一种方法。安装AbiWord。它可以在命令行知道的任何格式之间进行转换。要将文件夹中的所有.html文件转换为.pdf,您可以执行以下操作:

for file in *.html ; do abiword --to=pdf "$file" ; done

对于更高级别的排版(但可能更复杂),另一种选择是PrinceXML


2

根据要打印的html文档,使用pandoc可能会获得最佳效果。这是功能最全的HTML到LaTeX转换器之一。使用或可以很容易地将生成的.tex文件转换为PDF。如果您愿意研究LaTeX语法和软件包,可以使用很多选项。如果应保留嵌入式图像和精美的HTML样式,则此方法可能效果不佳。xelatexpdflatex


1

在google-chrome中,您可以使用扩展名为整个网站创建pdf文件。我个人使用Web2PDF Converter扩展程序,只需单击一下即可生成PDF。

这是此插件的屏幕截图,由Google扩展网站商店网站提供。

在此处输入图片说明

此外,通过下载下一个(正确的提示,将目标另存为),您可以看到由我使用此工具创建的PDF:http : //geppettvs.servehttp.com/resources/askubuntu-com.pdf(某些浏览器,例如google- chrome可能使您可以在线查看此内容。

而且,如果您希望编辑由扩展名创建的PDF,以便删除扩展名在每页底部放置的数字签名或删除其他任何内容,请查看以下内容:从PDF删除文本信息?

祝好运!

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.