我编写了一个bash脚本,该脚本使用curl从网站获取输出,并对html输出进行一堆字符串操作。问题是,当我在返回已压缩输出的站点上运行它时。在浏览器中转到该站点工作正常。
当我手动执行curl时,得到的压缩输出为:
$ curl "http://example.com"
这是该特定网站的标题:
HTTP/1.1 200 OK
Server: nginx
Content-Type: text/html; charset=utf-8
X-Powered-By: PHP/5.2.17
Last-Modified: Sat, 03 Dec 2011 00:07:57 GMT
ETag: "6c38e1154f32dbd9ba211db8ad189b27"
Expires: Sun, 19 Nov 1978 05:00:00 GMT
Cache-Control: must-revalidate
Content-Encoding: gzip
Content-Length: 7796
Date: Sat, 03 Dec 2011 00:46:22 GMT
X-Varnish: 1509870407 1509810501
Age: 504
Via: 1.1 varnish
Connection: keep-alive
X-Cache-Svr: p2137050.pubip.peer1.net
X-Cache: HIT
X-Cache-Hits: 425
我知道返回的数据已压缩,因为这将按预期返回html:
$ curl "http://example.com" | gunzip
我不想通过gunzip传递输出,因为脚本可以在其他站点上按原样工作,而通过gzip传递将破坏该功能。
我尝试过的
- 更改用户代理(我尝试使用浏览器发送的相同字符串,“ Mozilla / 4.0”等)
- 男子卷曲
- 谷歌搜索
- 搜索stackoverflow
一切都是空的
有任何想法吗?
curl 7.54.0 (x86_64-apple-darwin17.0) libcurl/7.54.0 LibreSSL/2.0.20 zlib/1.2.11 nghttp2/1.24.0
)-通过br
从中删除将其解决Accept-Encoding
。看到stackoverflow.com/questions/18983719/...