我正在寻找一种将网页转换为PDF的方法,但要保留网页的外观。同时保留网页的文本(可以选择),可搜索[为网页生成图像截图会使文本既不可选择也不可搜索]。
我正在寻找将网页原样打印为PDF的方式(就像在网络浏览器上一样),而无需对样式或对齐方式进行任何操作,也不会丢失任何网页的静态组件。
这将有助于保留易于阅读,注释和搜索的网页离线副本。
您无需阅读以下任何内容(问题仅是以上部分)即可获得我的问题。以下部分仅以嵌套的方式列出我通过研究或他人的答案所获得的知识,以便找到问题的答案。
研究成果(建议未能解决我的问题)
到现在为止尝试寻找解决方案的结果(对于该问题,所有解决方案仍无法正常工作)
我已经尝试过这些PDF Web打印引擎,但是所有操作都操纵页面的外观,甚至会破坏页面并使它们难以阅读:(示例屏幕截图包含在方括号中)
- Chrome [ 原始,打印样式(已禁用 | 未禁用)]
- Firefox [ 原始,打印样式(禁用p1,p2 |禁用p1,p2)]
- 可读性
- 它简化了网页(这对于集中阅读是一件好事,但是,这不是我想要的)。我正在寻找将所有在Web浏览器上看到的网页的positions / styles属性保留为PDF格式,而无需进行任何操作。
- 福昕阅读器
- NovaPDF
- CutyCapt [ Original,缩放系数:0.4:截图,输出PDF]
- 解决Windows上程序的运行问题后,我将添加链接”
- wkhtmltopdf [ 原始,缩放倍数:0.4:屏幕截图,输出PDF ]
- 它不支持CSS3。
所有网页屏幕截图图像捕获插件(例如Abduction,Awesome屏幕截图,Fireshot,Firefox屏幕截图开发人员工具,Full Page屏幕捕获,Page2Images,web-capture,...)都无法回答我的问题,因为它们不保留文本和链接。
Scrible非常适合保存网页以及进行进一步的注释和研究,但是不幸的是,它仍然在线且没有转换为PDF格式。
社区中还有两个其他问题与我的相似,但是,这个问题有些不同,但有一些重要的区别:
- 如何在网络浏览器中获取“所见即所得”(打印所见内容)?
- 这个问题询问一种捕获网页的方法(如在屏幕上看到的),即使它是图像和文本也不会被保留。而我也在寻找捕获文本和链接的方法(重要的是保留文本和链接)。
在不需要保留文本和链接的情况下,存在更多类似的问题(页面大多作为图像截图捕获):
- 使用屏幕CSS从浏览器打印?
- 它询问有关禁用打印样式的问题,似乎对上述屏幕快照没有帮助。
笔记
作业系统:Windows 10