请求-如何判断您是否收到404


139

我正在使用请求库并通过以下代码访问网站以从中收集数据:

r = requests.get(url)

我想为输入不正确的URL并返回404错误时添加错误测试。如果我有意输入无效的URL,请执行以下操作:

print r

我得到这个:

<Response [404]>

编辑:

我想知道如何测试。对象类型仍然相同。当我执行r.content或时r.text,我仅获得自定义404页面的HTML。


2
请查看文档:docs.python-requests.org/en/latest第一页指出了r.status_code
Udo Klein

Answers:


307

看一下r.status_code属性

if r.status_code == 404:
    # A 404 was issued.

演示:

>>> import requests
>>> r = requests.get('http://httpbin.org/status/404')
>>> r.status_code
404

如果要requests引发错误代码(4xx或5xx)的异常,请致电r.raise_for_status()

>>> r = requests.get('http://httpbin.org/status/404')
>>> r.raise_for_status()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "requests/models.py", line 664, in raise_for_status
    raise http_error
requests.exceptions.HTTPError: 404 Client Error: NOT FOUND
>>> r = requests.get('http://httpbin.org/status/200')
>>> r.raise_for_status()
>>> # no exception raised.

您还可以在布尔上下文中测试响应对象。如果状态代码不是错误代码(4xx或5xx),则将其视为“ true”:

if r:
    # successful response

如果要更明确,请使用if r.ok:


1
该死的,这很烦人。我希望有一种方法可以使request.get除2XX以外的任何原因提高,而不必进行额外的调用。
阿斯凡德·卡兹

@AsfandQazi:为什么要为1xx或3xx状态代码引发异常?这些不是错误条件。
马丁·彼得斯

2
1xx和3xx应该(并且)由库透明地处理。我在专门谈论4xx错误。当然,有时您可能希望读取4xx响应,因此我们不应该将其强加给每个人,但是我希望有一个可以传递给它的标志,.get()而不是之后再调用函数。
阿桑德·卡兹

@AsfandQazi:如果这对您很重要,那么编写自己的包装函数很简单。
马丁·彼得斯

1
似乎有点不整洁,仅此
而已
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.