有一些网站将书籍作为HTML页面提供(例如法律资料)。
我可以根据现有结构从这些页面创建PDF书籍吗?
在Windows中,有Adobe Professional(商业软件)。我猜Linux有免费的东西吗?一个涉及脚本的解决方案对我来说可以。
有一些网站将书籍作为HTML页面提供(例如法律资料)。
我可以根据现有结构从这些页面创建PDF书籍吗?
在Windows中,有Adobe Professional(商业软件)。我猜Linux有免费的东西吗?一个涉及脚本的解决方案对我来说可以。
Answers:
最简单的方法?从浏览器中选择文件>打印。选择“ 打印到文件”作为打印机,它将询问您想要的位置。确保标记PDF。点击“打印”,它将实际保存到驱动器中,而不是实际打印。
Htmldoc可能有用,请在此处查看;http://www.htmldoc.org/可以从软件中心获得,可悲的是1.8版本的unicode编码文件有问题,但是在许多情况下它仍然是一个救星,该问题已在1.9开发版本中解决。
我通常在这里使用精彩的剪贴簿扩展名;http://amb.vis.ne.jp/mozilla/scrapbook/以便Firefox捕获网页,如果需要,使用剪贴簿中的编辑工具对其进行修复,然后使用htmldoc将所有页面转换为PDF。
您可以尝试http://www.xhtml2pdf.com/。它是HTML / XHTML和CSS到PDF的转换器。全部用Python编写。
我建议使用OpenOffice / LibreOffice创建PDF。作为测试,我下载了Wget手册(全部一页),然后在OponOffice中打开HTML页面,然后单击“直接导出为PDF”按钮。它使用目录中的索引创建了PDF。
过去,我发现这是将HTML页面转换为PDF的最简单方法。它还使您可以轻松进行更改。
屏幕截图:
在google-chrome中,您可以使用扩展名为整个网站创建pdf文件。我个人使用Web2PDF Converter扩展程序,只需单击一下即可生成PDF。
这是此插件的屏幕截图,由Google扩展网站商店网站提供。
此外,通过下载下一个(正确的提示,将目标另存为),您可以看到由我使用此工具创建的PDF:http : //geppettvs.servehttp.com/resources/askubuntu-com.pdf(某些浏览器,例如google- chrome可能使您可以在线查看此内容。
而且,如果您希望编辑由扩展名创建的PDF,以便删除扩展名在每页底部放置的数字签名或删除其他任何内容,请查看以下内容:从PDF删除文本信息?
祝好运!
for file in *.html ; do ebook-convert "$file" "${file%.html}.pdf" ; done
,它将文件夹中的所有html文件转换为PDF。