从URL将文件下载到服务器


341

好吧,这看起来很简单,确实如此。将文件下载到服务器所需要做的就是:

file_put_contents("Tmpfile.zip", file_get_contents("http://someurl/file.zip"));

只有一个问题。如果文件很大,例如100mb,该怎么办?然后,您将耗尽内存,并且无法下载文件。

我想要的是一种在下载文件时将文件写入磁盘的方法。这样,我可以下载更大的文件,而不会遇到内存问题。


4
这是在你的服务器配置设置,PHP不能真正得到解决它,据我所知(除了直接的.ini编辑)

Answers:


494

从PHP 5.1.0开始,file_put_contents()支持通过传递流句柄作为$data参数来逐段编写:

file_put_contents("Tmpfile.zip", fopen("http://someurl/file.zip", 'r'));

从手册中:

如果数据 [是第二个参数]是流资源,则该流的剩余缓冲区将被复制到指定文件。这与使用相似 stream_copy_to_stream()

(感谢Hakre。)


4
那不是我的第一选择。如果allow_fopen_url Off在php.ini中设置(出于安全性的考虑),您的脚本将被破坏。
请在

4
file_get_contents()如果是这种情况,我认为@idealmachine也将不起作用(请参阅OP)。
alex

10
@geoff我很具体,我提到了您想要的功能。您可能想要的是有人为您编写代码-但我敢肯定,您会学到一些自己做的东西。另外,如果我们要评论彼此的SO交互- 请接受更多答案 :)
alex

@alex:请查看编辑,随时添加。让我知道何时可以在此处删除此评论。
2013年

4
在大多数情况下,也应使用'b'标志fopen;防止对图像和其他非纯文本文件产生不利影响。
韦恩·韦伯

132
private function downloadFile($url, $path)
{
    $newfname = $path;
    $file = fopen ($url, 'rb');
    if ($file) {
        $newf = fopen ($newfname, 'wb');
        if ($newf) {
            while(!feof($file)) {
                fwrite($newf, fread($file, 1024 * 8), 1024 * 8);
            }
        }
    }
    if ($file) {
        fclose($file);
    }
    if ($newf) {
        fclose($newf);
    }
}

1
感谢您的摘录,但是您能够解释代码@xaav吗?我不太擅长php。1024 * 8的用途是什么?再次感谢。
vvMINOvv 2011年

@wMINOw行的长度。
DavidBélanger2012年

2
具体来说,这意味着一次读取最多8KB(每KB 1024字节* 8),因为该参数以字节为单位。只要该行<= 8KB,它将立即读取整行。
Doktor J

1
为什么这不是最佳答案?
GunJack 2013年

1
您如何使用这种方法处理错误?如果返回404或连接中断或超时怎么办?
亚当·斯温登2014年

67

尝试使用cURL

set_time_limit(0); // unlimited max execution time
$options = array(
  CURLOPT_FILE    => '/path/to/download/the/file/to.zip',
  CURLOPT_TIMEOUT =>  28800, // set this to 8 hours so we dont timeout on big files
  CURLOPT_URL     => 'http://remoteserver.com/path/to/big/file.zip',
);

$ch = curl_init();
curl_setopt_array($ch, $options);
curl_exec($ch);
curl_close($ch);

我不确定,但是我相信CURLOPT_FILE它在提取数据时会写入的选项,即。没有缓冲。


2
通常,这很好,但是我在Web应用程序中有此代码,因此我不能确定用户将安装cURL。但是,我确实对此投了赞成票。
xaav 2010年

@Geoff是分布式Web应用程序吗?因为如果您控制托管,则与用户无关(cURL是服务器上的库)。
alex

不,我不控制托管。它是任何人都可以拥有的分布式Web应用程序。
xaav 2010年

3
卷毛可能丢失。但是,几乎所有共享托管公司默认都安装了CURL。我的意思是,我还没有看过没有的人。
Mangirdas Skripka

19
根据我的测试,您不能直接为CURLOPT_FILE分配文件路径。它必须是文件处理程序。首先,使用打开文件,$fh = fopen('/path/to/download/the/file/to.zip', 'w');然后使用fclose($fh);after 关闭curl_close($ch);。并设定CURLOPT_FILE => $fh
古斯塔沃

22

prodigitalson的答案对我不起作用。我有missing fopen in CURLOPT_FILE 更多细节

这对我有用,包括本地网址:

function downloadUrlToFile($url, $outFileName)
{   
    if(is_file($url)) {
        copy($url, $outFileName); 
    } else {
        $options = array(
          CURLOPT_FILE    => fopen($outFileName, 'w'),
          CURLOPT_TIMEOUT =>  28800, // set this to 8 hours so we dont timeout on big files
          CURLOPT_URL     => $url
        );

        $ch = curl_init();
        curl_setopt_array($ch, $options);
        curl_exec($ch);
        curl_close($ch);
    }
}

19
  1. 在目标服务器中创建一个名为“下载”的文件夹
  2. 将[此代码]保存到.php文件中并在目标服务器中运行

下载器:

<html>
<form method="post">
<input name="url" size="50" />
<input name="submit" type="submit" />
</form>
<?php
    // maximum execution time in seconds
    set_time_limit (24 * 60 * 60);

    if (!isset($_POST['submit'])) die();

    // folder to save downloaded files to. must end with slash
    $destination_folder = 'downloads/';

    $url = $_POST['url'];
    $newfname = $destination_folder . basename($url);

    $file = fopen ($url, "rb");
    if ($file) {
      $newf = fopen ($newfname, "wb");

      if ($newf)
      while(!feof($file)) {
        fwrite($newf, fread($file, 1024 * 8 ), 1024 * 8 );
      }
    }

    if ($file) {
      fclose($file);
    }

    if ($newf) {
      fclose($newf);
    }
?>
</html> 

假设用户需要一个独立的脚本,而不是一个可以在现有PHP应用程序中运行的解决方案,并且我相信后者是OP和其他大多数人所寻找的。对于想要了解该方法的人来说,做出解释也是有帮助的。
肖恩·比恩

1
每当我尝试这样做时,我传输的文件大小总是50816,但是我的文件大小大于此大小。120MB ..知道为什么吗?
斯·斯塔尔

set_time_limit (24 * 60 * 60);必须放在一个循环中。它在脚本开头没有任何作用。
维克多·乔拉斯

16
set_time_limit(0); 
$file = file_get_contents('path of your file');
file_put_contents('file.ext', $file);

您的答案非常简单且有效,可以帮助我在cURL无法获取文件的情况下工作。谢谢:)
Tommix

2
您可能想解释一下这实际上是做什么的。
亚历克斯2015年

6
这不能解决OP超出PHP内存限制的问题。
user9645 '16

这非常简单明了。对于文件较小或环境为本地开发的较简单情况,这非常有用。
Valentine Shi

对.xlsx文件有任何想法吗?它正在存储具有0字节内存的空文件。
Dhruv Thakkar


8

在php中使用简单的方法 copy()

copy($source_url, $local_path_with_file_name);

注意:如果目标文件已经存在,它将被覆盖

PHP copy()函数

注意:您需要为目标文件夹设置权限777。当您下载到本地计算机时,请使用此方法。

特别说明:777是基于Unix的系统中的权限,对所有者,组和所有人都具有完全的读取/写入/执行权限。通常,我们对不需要在Web服务器上公开隐藏的资产授予此权限。示例:images文件夹。


1
我永远不会永远不会将777设置为Web服务器上的权限,并且我将揭开任何一个不愿意这样做的Web开发人员的想法。每次无处不在。小心点 !你不能这样做 !考虑安全性。仅仅遵循OWASP规则是不够的。善于思考简单的事情很重要。
ThierryB

@ThierryB。注意:我已经给出了本地路径。&这可以在内部应用程序中使用。具有良好的阅读和理解问题和答案的能力。考虑不同的情况。这是不被接受/最佳答案。每个问题都有其利与弊的不同答案。示例供您理解:甚至斐波那契也有多种独特的解决方案,其中只有一个是最佳的。其他将用于不同的场景。
Pradeep Kumar Prabaharan

好的,但是花一些时间思考最佳做法并在安全的地方实施这些最佳做法将使您对必须实施的概念有更好的了解。也许如果入侵者在您的($)房屋内,以最好的方式做一些陷阱或建造东西,可能会让他有些头疼;)
ThierryB

5

我用这个来下载文件

function cURLcheckBasicFunctions()
{
  if( !function_exists("curl_init") &&
      !function_exists("curl_setopt") &&
      !function_exists("curl_exec") &&
      !function_exists("curl_close") ) return false;
  else return true;
}

/*
 * Returns string status information.
 * Can be changed to int or bool return types.
 */
function cURLdownload($url, $file)
{
  if( !cURLcheckBasicFunctions() ) return "UNAVAILABLE: cURL Basic Functions";
  $ch = curl_init();
  if($ch)
  {

    $fp = fopen($file, "w");
    if($fp)
    {
      if( !curl_setopt($ch, CURLOPT_URL, $url) )
      {
        fclose($fp); // to match fopen()
        curl_close($ch); // to match curl_init()
        return "FAIL: curl_setopt(CURLOPT_URL)";
      }
      if ((!ini_get('open_basedir') && !ini_get('safe_mode')) || $redirects < 1) {
        curl_setopt($ch, CURLOPT_USERAGENT, '"Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.11) Gecko/20071204 Ubuntu/7.10 (gutsy) Firefox/2.0.0.11');
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
        //curl_setopt($ch, CURLOPT_REFERER, 'http://domain.com/');
        if( !curl_setopt($ch, CURLOPT_HEADER, $curlopt_header)) return "FAIL: curl_setopt(CURLOPT_HEADER)";
        if( !curl_setopt($ch, CURLOPT_FOLLOWLOCATION, $redirects > 0)) return "FAIL: curl_setopt(CURLOPT_FOLLOWLOCATION)";
        if( !curl_setopt($ch, CURLOPT_FILE, $fp) ) return "FAIL: curl_setopt(CURLOPT_FILE)";
        if( !curl_setopt($ch, CURLOPT_MAXREDIRS, $redirects) ) return "FAIL: curl_setopt(CURLOPT_MAXREDIRS)";

        return curl_exec($ch);
    } else {
        curl_setopt($ch, CURLOPT_USERAGENT, '"Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.11) Gecko/20071204 Ubuntu/7.10 (gutsy) Firefox/2.0.0.11');
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
        //curl_setopt($ch, CURLOPT_REFERER, 'http://domain.com/');
        if( !curl_setopt($ch, CURLOPT_FOLLOWLOCATION, false)) return "FAIL: curl_setopt(CURLOPT_FOLLOWLOCATION)";
        if( !curl_setopt($ch, CURLOPT_FILE, $fp) ) return "FAIL: curl_setopt(CURLOPT_FILE)";
        if( !curl_setopt($ch, CURLOPT_HEADER, true)) return "FAIL: curl_setopt(CURLOPT_HEADER)";
        if( !curl_setopt($ch, CURLOPT_RETURNTRANSFER, true)) return "FAIL: curl_setopt(CURLOPT_RETURNTRANSFER)";
        if( !curl_setopt($ch, CURLOPT_FORBID_REUSE, false)) return "FAIL: curl_setopt(CURLOPT_FORBID_REUSE)";
        curl_setopt($ch, CURLOPT_USERAGENT, '"Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.11) Gecko/20071204 Ubuntu/7.10 (gutsy) Firefox/2.0.0.11');
    }
      // if( !curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true) ) return "FAIL: curl_setopt(CURLOPT_FOLLOWLOCATION)";
      // if( !curl_setopt($ch, CURLOPT_FILE, $fp) ) return "FAIL: curl_setopt(CURLOPT_FILE)";
      // if( !curl_setopt($ch, CURLOPT_HEADER, 0) ) return "FAIL: curl_setopt(CURLOPT_HEADER)";
      if( !curl_exec($ch) ) return "FAIL: curl_exec()";
      curl_close($ch);
      fclose($fp);
      return "SUCCESS: $file [$url]";
    }
    else return "FAIL: fopen()";
  }
  else return "FAIL: curl_init()";
}

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.