2 是否有任何命令行通用HTTP代理(例如Squid)? 我可以轻松地使用Netcat(或Socat)来捕获浏览器和特定主机:端口之间的流量。 但是对于Linux,是否存在类似Squid的HTTP代理的任何命令行副本,我可以用来捕获HTTP客户端(浏览器或命令行程序)与任意host:port之间的流量? 9 command-line proxy http squid
2 除了SeleniumRC之外,还有没有其他好的工具可以提取包含JavaScript后绘制内容的网页? 一个主要的缺点curl是,越来越多的网页的主要内容是由在初始HTTP响应之后发生的JavaScript AJAX响应绘制的。curl永远不会选择此后涂内容。 因此,为了从命令行获取这些类型的网页,我被简化为用Ruby编写脚本,这些脚本驱动SeleniumRC启动Firefox实例,然后在这些AJAX调用完成后返回源HTML。 对于此类问题,使用精简的命令行解决方案会更好。有人知道吗? 8 wget http html curl selenium