网址不存在时的file_get_contents


73

我正在使用file_get_contents()访问URL。

file_get_contents('http://somenotrealurl.com/notrealpage');

如果URL不是真实的,它将返回此错误消息。我如何才能使其优雅地出错,以便使我知道该页面不存在,并在不显示此错误消息的情况下采取相应措施?

file_get_contents('http://somenotrealurl.com/notrealpage') 
[function.file-get-contents]: 
failed to open stream: HTTP request failed! HTTP/1.0 404 Not Found 
in myphppage.php on line 3

例如在zend中,您可以说: if ($request->isSuccessful())

$client = New Zend_Http_Client();
$client->setUri('http://someurl.com/somepage');

$request = $client->request();

if ($request->isSuccessful()) {
 //do stuff with the result
}

尝试使用流上下文:stackoverflow.com/questions/21800276/…,file_get_contents在后台使用fopen。
rsk82 2014年

Answers:


116

您需要检查HTTP响应代码

function get_http_response_code($url) {
    $headers = get_headers($url);
    return substr($headers[0], 9, 3);
}
if(get_http_response_code('http://somenotrealurl.com/notrealpage') != "200"){
    echo "error";
}else{
    file_get_contents('http://somenotrealurl.com/notrealpage');
}

5
如果您需要知道请求失败的原因,那么最好使用这种技术。检查状态码(例如,可能需要以与503不同的方式处理404)。如果不是,则可能会引入两个请求,因此最好忽略。
2010年

1
虽然这是一个不错的解决方案,但它不会考虑其他http错误代码(例如500)。因此,一个简单的调整可能是:$headers = get_headers($uri); if (stripos($headers[0], '40') !== false || stripos($headers[0], '50') !== false) { ...handle errors... }
YOMorales 2012年

14
我认为这段代码是错误的。您get_headers只有在file_get_contents退货时才致电false。每个URL两次调用没有太大意义。除非您期望大多数URL都会失败。$http_response_header如果状态为4xx或5xx的情况是空的,那真是可悲。到此为止,我们根本不需要get_headers
mgutt 2015年

太棒了!谢谢。
moreirapontocom

63

使用PHP中的此类命令,可以在其前面添加前缀,@以禁止显示此类警告。

@file_get_contents('http://somenotrealurl.com/notrealpage');

FALSE如果发生故障,则file_get_contents()返回,因此如果您对照该结果检查返回的结果,则可以处理故障

$pageDocument = @file_get_contents('http://somenotrealurl.com/notrealpage');

if ($pageDocument === false) {
    // Handle error
}

3
我不想只是抑制错误。我想知道网址是否有效。
萨米(Sami)2010年

请注意,如果服务器关闭,该功能可能会阻塞一段时间。
Alex Jasmin '12

@sami当您说“有效”时,您是指有效的URL还是“作品”?
2010年

2
对我来说是完美的解决方案。感谢¡
果酱

1
你从字面上拯救了我。在尝试您的解决方案之前,我浪费了时间尝试实施其他解决方案。万分感谢
Vickar

28

每次file_get_contents使用http包装器调用时,都会在本地范围内创建一个变量:$ http_response_header

此变量包含所有HTTP标头。get_headers()由于仅执行一个请求,因此该方法优于功能。

注意:2个不同的请求可以不同地结束。例如,get_headers()将返回503,而file_get_contents()将返回200。并且您将获得正确的输出,但由于get_headers()调用中出现503错误而无法使用它。

function getUrl($url) {
    $content = file_get_contents($url);
    // you can add some code to extract/parse response number from first header. 
    // For example from "HTTP/1.1 200 OK" string.
    return array(
            'headers' => $http_response_header,
            'content' => $content
        );
}

// Handle 40x and 50x errors
$response = getUrl("http://example.com/secret-message");
if ($response['content'] === FALSE)
    echo $response['headers'][0];   // HTTP/1.1 401 Unauthorized
else
    echo $response['content'];

此方法还使您能够跟踪存储在不同变量中的几个请求标头,因为如果使用file_get_contents(),则$ http_response_header会在本地范围内被覆盖。


1
这很完美,它节省了额外的请求,这使我的+1 ..我正在处理生成成千上万个URL的缓存..因此必须对请求加倍才是荒谬的。
jenovachild

16

虽然file_get_contents非常简洁和方便,但我倾向于偏爱Curl库以获得更好的控制。这是一个例子。

function fetchUrl($uri) {
    $handle = curl_init();

    curl_setopt($handle, CURLOPT_URL, $uri);
    curl_setopt($handle, CURLOPT_POST, false);
    curl_setopt($handle, CURLOPT_BINARYTRANSFER, false);
    curl_setopt($handle, CURLOPT_HEADER, true);
    curl_setopt($handle, CURLOPT_RETURNTRANSFER, true);
    curl_setopt($handle, CURLOPT_CONNECTTIMEOUT, 10);

    $response = curl_exec($handle);
    $hlength  = curl_getinfo($handle, CURLINFO_HEADER_SIZE);
    $httpCode = curl_getinfo($handle, CURLINFO_HTTP_CODE);
    $body     = substr($response, $hlength);

    // If HTTP response is not 200, throw exception
    if ($httpCode != 200) {
        throw new Exception($httpCode);
    }

    return $body;
}

$url = 'http://some.host.com/path/to/doc';

try {
    $response = fetchUrl($url);
} catch (Exception $e) {
    error_log('Fetch URL failed: ' . $e->getMessage() . ' for ' . $url);
}

是的,curl库要好得多-我从不file_get_contents()亲自获取URL ,我不喜欢那样使用流包装器,感觉有点片状。
2010年

5

简单实用(易于在任何地方使用):

function file_contents_exist($url, $response_code = 200)
{
    $headers = get_headers($url);

    if (substr($headers[0], 9, 3) == $response_code)
    {
        return TRUE;
    }
    else
    {
        return FALSE;
    }
}

例:

$file_path = 'http://www.google.com';

if(file_contents_exist($file_path))
{
    $file = file_get_contents($file_path);
}

5

为了避免重复请求作为评论说Orbling上的答案YNH你可以结合自己的答案。如果您首先收到有效的回复,请使用该回复。如果没有发现问题出在哪里(如果需要)。

$urlToGet = 'http://somenotrealurl.com/notrealpage';
$pageDocument = @file_get_contents($urlToGet);
if ($pageDocument === false) {
     $headers = get_headers($urlToGet);
     $responseCode = substr($headers[0], 9, 3);
     // Handle errors based on response code
     if ($responseCode == '404') {
         //do something, page is missing
     }
     // Etc.
} else {
     // Use $pageDocument, echo or whatever you are doing
}

2

您可以在选项中添加'ignore_errors'=> true:

$options = array(
  'http' => array(
    'ignore_errors' => true,
    'header' => "Content-Type: application/json\r\n"
    )
);
$context  = stream_context_create($options);
$result = file_get_contents('http://example.com', false, $context);

在这种情况下,您将能够从服务器读取响应。


0
$url = 'https://www.yourdomain.com';

正常

function checkOnline($url) {
    $headers = get_headers($url);
    $code = substr($headers[0], 9, 3);
    if ($code == 200) {
        return true;
    }
    return false;
}

if (checkOnline($url)) {
    // URL is online, do something..
    $getURL = file_get_contents($url);     
} else {
    // URL is offline, throw an error..
}

专业版

if (substr(get_headers($url)[0], 9, 3) == 200) {
    // URL is online, do something..
}

WTF级

(substr(get_headers($url)[0], 9, 3) == 200) ? echo 'Online' : echo 'Offline';
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.