如何实施基本的“长轮询”?


776

我可以找到许多有关Long Polling工作原理的信息(例如thisthis),但是没有简单的示例说明如何在代码中实现这一点。

我所能找到的就是cometd,它依赖于Dojo JS框架和一个相当复杂的服务器系统。

基本上,我将如何使用Apache来处理请求,以及如何编写一个简单的脚本(例如PHP)来“长时间轮询”服务器以获取新消息?

该示例不必是可伸缩的,安全的或完整的,只需要工作即可!

Answers:


512

它比我最初想象的要简单。基本上,您只有一个页面不执行任何操作,直到您要发送的数据可用(例如,收到新消息)为止。

这是一个非常基本的示例,它会在2-10秒后发送一个简单的字符串。1/3的机会返回错误404(以显示即将到来的Javascript示例中的错误处理)

msgsrv.php

<?php
if(rand(1,3) == 1){
    /* Fake an error */
    header("HTTP/1.0 404 Not Found");
    die();
}

/* Send a string after a random number of seconds (2-10) */
sleep(rand(2,10));
echo("Hi! Have a random number: " . rand(1,10));
?>

注意:在真实站点上,在像Apache这样的常规Web服务器上运行该站点将很快占用所有“工作线程”,并使它无法响应其他请求。有很多解决方法,但是建议编写类似于Python的Twisted的“长轮询服务器” ,该服务器不依赖每个请求一个线程。cometD是一种流行的语言(有多种语言可用),而Tornado是专门为此类任务创建的新框架(它是为FriendFeed的长轮询代码构建的)...但是作为一个简单的示例,Apache绰绰有余!该脚本可以很容易地用任何一种语言编写(我选择了Apache / PHP,因为它们很常见,而我恰巧是在本地运行它们)

然后,在Javascript中,您请求上述文件(msg_srv.php),然后等待响应。当您得到一个时,就对数据进行操作。然后,您请求文件并再次等待,对数据进行操作(并重复)

以下是此类页面的示例。.加载页面后,它将发送对msgsrv.php文件的初始请求。如果成功,则将消息附加到#messagesdiv,然后在1秒钟后再次调用waitForMsg函数,触发等待。

1秒setTimeout()是一个非常基本的速率限制器,没有此限制,它就可以正常工作,但是如果msgsrv.php 总是立即返回(例如,出现语法错误),则会使浏览器泛滥,并迅速冻结。最好检查文件是否包含有效的JSON响应,和/或保持每分钟/秒的运行请求总数,并适当地暂停。

如果页面错误,它将错误附加到#messagesdiv,等待15秒,然后重试(与我们在每条消息后等待1秒的方式相同)

这种方法的好处是它非常灵活。如果客户端的互联网连接断开,它将超时,然后尝试重新连接-这是轮询工作多长时间所固有的,不需要复杂的错误处理

无论如何,long_poller.htm使用jQuery框架的代码:

<html>
<head>
    <title>BargePoller</title>
    <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.2.6/jquery.min.js" type="text/javascript" charset="utf-8"></script>

    <style type="text/css" media="screen">
      body{ background:#000;color:#fff;font-size:.9em; }
      .msg{ background:#aaa;padding:.2em; border-bottom:1px #000 solid}
      .old{ background-color:#246499;}
      .new{ background-color:#3B9957;}
    .error{ background-color:#992E36;}
    </style>

    <script type="text/javascript" charset="utf-8">
    function addmsg(type, msg){
        /* Simple helper to add a div.
        type is the name of a CSS class (old/new/error).
        msg is the contents of the div */
        $("#messages").append(
            "<div class='msg "+ type +"'>"+ msg +"</div>"
        );
    }

    function waitForMsg(){
        /* This requests the url "msgsrv.php"
        When it complete (or errors)*/
        $.ajax({
            type: "GET",
            url: "msgsrv.php",

            async: true, /* If set to non-async, browser shows page as "Loading.."*/
            cache: false,
            timeout:50000, /* Timeout in ms */

            success: function(data){ /* called when request to barge.php completes */
                addmsg("new", data); /* Add response to a .msg div (with the "new" class)*/
                setTimeout(
                    waitForMsg, /* Request next message */
                    1000 /* ..after 1 seconds */
                );
            },
            error: function(XMLHttpRequest, textStatus, errorThrown){
                addmsg("error", textStatus + " (" + errorThrown + ")");
                setTimeout(
                    waitForMsg, /* Try again after.. */
                    15000); /* milliseconds (15seconds) */
            }
        });
    };

    $(document).ready(function(){
        waitForMsg(); /* Start the inital request */
    });
    </script>
</head>
<body>
    <div id="messages">
        <div class="msg old">
            BargePoll message requester!
        </div>
    </div>
</body>
</html>

7
使用此想法会不会漏掉一些消息?在这1秒钟的超时时间内,例如发送了1000条聊天消息,服务器将如何知道将1000条消息专门发送给该客户端?
DevDevDev

15
大概。为了说明这一概念,这是一个非常简化的示例。要更好地做到这一点,您将需要更复杂的服务器端代码,在该代码中,它将存储该特定客户端的那1000条消息,并将它们发送为一个块。您还可以安全地减少waitForMsg超时时间
-dbr

21
nodejs是用于长轮询请求的另一个出色的服务器端解决方案,它的另一个优点(相对于Twisted)还可以使用Javascript编写服务器代码。
赫斯基

8
这只是一个间隔为1秒的普通AJAX与服务器的周期性连接。这与“长时间轮询”无关。只要客户端超时,长时间轮询就可以使连接保持活动状态。
Deele

6
问题是什么才是真正的PHP脚本而不是sleep(rand(2,10));?为了什么也不做,每100毫秒轮询一次数据库?什么时候决定死?
Luis Siquot 2011年

41

作为slosh的一部分,我有一个非常简单的聊天示例。

编辑:(因为每个人都在这里粘贴他们的代码)

这是使用long-polling和slosh的完整的基于JSON的多用户聊天。这是有关如何进行呼叫的演示,因此请忽略XSS问题。任何人都必须首先对其进行消毒而部署它。

请注意,客户端始终与服务器建立连接,并且只要有人发送消息,每个人都应该大致立即看到它。

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<!-- Copyright (c) 2008 Dustin Sallings <dustin+html@spy.net> -->
<html lang="en">
  <head>
    <title>slosh chat</title>
    <script type="text/javascript"
      src="http://code.jquery.com/jquery-latest.js"></script>
    <link title="Default" rel="stylesheet" media="screen" href="style.css" />
  </head>

  <body>
    <h1>Welcome to Slosh Chat</h1>

    <div id="messages">
      <div>
        <span class="from">First!:</span>
        <span class="msg">Welcome to chat. Please don't hurt each other.</span>
      </div>
    </div>

    <form method="post" action="#">
      <div>Nick: <input id='from' type="text" name="from"/></div>
      <div>Message:</div>
      <div><textarea id='msg' name="msg"></textarea></div>
      <div><input type="submit" value="Say it" id="submit"/></div>
    </form>

    <script type="text/javascript">
      function gotData(json, st) {
        var msgs=$('#messages');
        $.each(json.res, function(idx, p) {
          var from = p.from[0]
          var msg = p.msg[0]
          msgs.append("<div><span class='from'>" + from + ":</span>" +
            " <span class='msg'>" + msg + "</span></div>");
        });
        // The jQuery wrapped msgs above does not work here.
        var msgs=document.getElementById("messages");
        msgs.scrollTop = msgs.scrollHeight;
      }

      function getNewComments() {
        $.getJSON('/topics/chat.json', gotData);
      }

      $(document).ready(function() {
        $(document).ajaxStop(getNewComments);
        $("form").submit(function() {
          $.post('/topics/chat', $('form').serialize());
          return false;
        });
        getNewComments();
      });
    </script>
  </body>
</html>

1
我可以知道它总是如何连接的吗?对不起,如果我问傻话,但我想知道。
罗基·辛格

4
它执行HTTP GET,服务器阻止GET,直到有可用数据为止。当数据到达服务器时,服务器将数据返回给客户端,将其他可能进入的队列排队,然后客户端重新连接并拾取丢失的消息(如果有),否则再次阻塞。
达斯汀

4
乍一看可能并不明显,但是事情是负责“始终保持连接状态”的是带有getNewComments回调的ajaxStop,因此它会不断地在每个ajax请求结束时触发它
baldrs 2016年

32

Tornado是为长时间轮询而设计的,并且在/ examples / chatdemo中包括了一个非常少的(几百行Python)聊天应用程序,包括服务器代码和JS客户端代码。它的工作方式如下:

  • 客户端使用JS来请求更新,因为(最后一条消息的数量),服务器URLHandler接收到这些更新,并添加了一个回调以响应客户端到队列。

  • 当服务器收到新消息时,onmessage事件将触发,循环遍历回调并发送消息。

  • 客户端JS接收消息,将其添加到页面中,然后请求更新,因为此新的消息ID。


25

我认为客户端看起来像一个普通的异步AJAX请求,但是您希望它花很长时间才能回来。

然后服务器看起来像这样。

while (!hasNewData())
    usleep(50);

outputNewData();

因此,AJAX请求将发送到服务器,其中可能包括上次更新时间的时间戳,以便您hasNewData()知道已获取的数据。然后,服务器处于循环睡眠状态,直到有新数据可用为止。一直以来,您的AJAX请求仍处于连接状态,只是挂在那里等待数据。最后,当有新数据可用时,服务器会将其提供给您的AJAX请求并关闭连接。


10
这是一个繁忙的等待,阻塞了您当前的线程。这根本无法扩展。
Wouter Lievens

10
不,不睡觉不忙。“等待”的全部要点是阻塞您的线程一段时间。可能他的意思是50毫秒(usleep(50000)),而不是50微秒!但是无论如何,使用典型的Apache / PHP设置,还有其他方法可以做到这一点吗?
马特

好吧,从原则上讲,您不能在没有等待的情况下为聊天消息设置阻止功能。
托马什Zato -恢复莫妮卡

真的很棒!我在服务器中构建了一个递归函数来检查新数据。但是,有效利用长轮询的最佳产品是什么?我使用普通的Apache,当我打开超过4/5个浏览器选项卡时,服务器没有响应:(寻找与PHP配合使用的东西
Moderns

17

是一些我在C#中用于长轮询的类。基本上有6个班级(见下文)。

  1. 控制器:处理创建有效响应所需的操作(db操作等)
  2. 处理器:管理与网页的异步通信(本身)
  3. IAsynchProcessor:服务处理实现此接口的实例
  4. 服务:处理实现IAsynchProcessor的请求对象
  5. 请求:包含您的响应(对象)的IAsynchProcessor包装器
  6. 响应:包含自定义对象或字段

2
好吧...所以这为什么被否决了?这些类确实是长轮询的有效示例。
囚犯零

真正的长轮询不是(简单地)在您对资源进行普通轮询时增加间隔的做法。它是较大模式的一部分...“有些”需要解释...但仅在整体实现的某些方面。就是说...这些课程遵循上述模式!因此,如果您有理由对此表示反对,我真的会对这个原因感兴趣。
囚犯零2012年

也许它被否决了,因为它没有直接解决简单代码示例的问题。当然我没有否决它,所以我只能猜测。
安德鲁

16

这是一个不错的5分钟截屏视频,介绍了如何使用PHP和jQuery进行长时间轮询:http : //screenr.com/SNH

代码与上面dbr的示例非常相似。


3
我认为您应该只将其作为长轮询的介绍,因为这种实现肯定会杀死具有许多并发用户的服务器。
艾尔弗雷德(Alfred)2010年

我只是在了解所有这些信息...几个用户是否可靠...说10往回聊?
somdow 2012年

12

这是Erik Dubbelboer在PHP中使用Content-type: multipart/x-mixed-replace标头的简单长轮询示例

<?

header('Content-type: multipart/x-mixed-replace; boundary=endofsection');

// Keep in mind that the empty line is important to separate the headers
// from the content.
echo 'Content-type: text/plain

After 5 seconds this will go away and a cat will appear...
--endofsection
';
flush(); // Don't forget to flush the content to the browser.


sleep(5);


echo 'Content-type: image/jpg

';

$stream = fopen('cat.jpg', 'rb');
fpassthru($stream);
fclose($stream);

echo '
--endofsection
';

这是一个演示:

http://dubbelboer.com/multipart.php


11

我使用来了解Comet,我还使用Java Glassfish服务器设置了Comet,并通过订阅cometdaily.com找到了许多其他示例。



9

以下是我为Inform8 Web开发的长轮询解决方案。基本上,您可以重写该类并实现loadData方法。当loadData返回一个值或操作超时时,它将打印结果并返回。

如果脚本处理时间可能超过30秒,则可能需要将set_time_limit()调用更改为更长的时间。

Apache 2.0许可证。github上的最新版本 https://github.com/ryanhend/Inform8/blob/master/Inform8-web/src/config/lib/Inform8/longpoll/LongPoller.php

瑞安

abstract class LongPoller {

  protected $sleepTime = 5;
  protected $timeoutTime = 30;

  function __construct() {
  }


  function setTimeout($timeout) {
    $this->timeoutTime = $timeout;
  }

  function setSleep($sleep) {
    $this->sleepTime = $sleepTime;
  }


  public function run() {
    $data = NULL;
    $timeout = 0;

    set_time_limit($this->timeoutTime + $this->sleepTime + 15);

    //Query database for data
    while($data == NULL && $timeout < $this->timeoutTime) {
      $data = $this->loadData();
      if($data == NULL){

        //No new orders, flush to notify php still alive
        flush();

        //Wait for new Messages
        sleep($this->sleepTime);
        $timeout += $this->sleepTime;
      }else{
        echo $data;
        flush();
      }
    }

  }


  protected abstract function loadData();

}

8

感谢您的代码dbr。只是一个小错字在long_poller.htm周围的线

1000 /* ..after 1 seconds */

我认为应该

"1000"); /* ..after 1 seconds */

为它工作。

对于那些感兴趣的人,我尝试了一个等效的Django。启动一个新的Django项目,说lp进行长时间轮询:

django-admin.py startproject lp

调用消息服务器的应用程序msgsrv

python manage.py startapp msgsrv

将以下行添加到settings.py以具有模板目录:

import os.path
PROJECT_DIR = os.path.dirname(__file__)
TEMPLATE_DIRS = (
    os.path.join(PROJECT_DIR, 'templates'),
)

像这样在urls.py中定义URL模式:

from django.views.generic.simple import direct_to_template
from lp.msgsrv.views import retmsg

urlpatterns = patterns('',
    (r'^msgsrv\.php$', retmsg),
    (r'^long_poller\.htm$', direct_to_template, {'template': 'long_poller.htm'}),
)

并且msgsrv / views.py应该看起来像:

from random import randint
from time import sleep
from django.http import HttpResponse, HttpResponseNotFound

def retmsg(request):
    if randint(1,3) == 1:
        return HttpResponseNotFound('<h1>Page not found</h1>')
    else:
        sleep(randint(2,10))
        return HttpResponse('Hi! Have a random number: %s' % str(randint(1,10)))

最后,templates / long_poller.htm应该与上面的相同,并且输入错误得到纠正。希望这可以帮助。


其实"15000"是语法错误。setTimeout将整数作为其第二个参数。
Andrew Hedges,2010年

这个答案需要工作。它是一个或多个评论以及一个或多个单独答案的最终结果。
布莱恩·韦伯斯特2012年

8

这是PHP是非常糟糕的选择的场景之一。如前所述,您可以快速捆绑所有Apache工作者,执行类似的操作。PHP是为启动,执行,停止而构建的。它不是为启动而创建的,请稍等...执行,停止。您将很快停顿服务器,发现您遇到难以置信的扩展问题。

也就是说,您仍然可以使用PHP进行此操作,并且不使用nginx HttpPushStreamModule杀死服务器:http ://wiki.nginx.org/HttpPushStreamModule

您可以在Apache(或其他任何工具)之前设置nginx,它将负责保持打开并发连接。您只需通过将数据发送到内部地址来响应有效负载,这可以通过后台作业来完成,或者只是在新请求到来时将消息发送给正在等待的人。这可以防止PHP进程在长时间轮询期间处于打开状态。

这不是PHP独有的,可以使用nginx和任何后端语言来完成。并发开放连接负载等于Node.js,因此最大的好处就是它可以使您摆脱NEEDING Node的负担。

您会看到很多其他人提到其他语言库来完成长时间轮询,这是有充分理由的。自然,PHP并不是针对这种行为而构建的。


这是Apache问题还是PHP问题?如果我的PHP代码直接在nginx或lighttpd上运行,我会遇到长时间轮询的问题吗?
大卫

这不是一个PHP问题,而是一个PHP滥用问题。在每个请求上,PHP都会从头开始运行脚本,根据需要加载库,执行其代码,然后在垃圾收集请求中启动的所有内容时关闭脚本。多年来,对PHP进行了许多修改,以最大程度地减少后期静态绑定,延迟加载,内存字节码缓存中的影响,以删除磁盘I / O等影响。问题仍然在于,PHP打算以最快的速度启动和停止尽可能。每次引导时将加载一次并为请求打开线程的语言更适合于长时间轮询。
Brightball

但是要回答这个问题,是的,无论您使用的是Apache还是其他工具,您都将遇到此问题。这就是PHP的工作方式。我应该修正一下,如果您将拥有已知的最大流量负载,PHP将会很好。我看到使用PHP的嵌入式系统没有问题,因为只有几个连接。潜在地在公司Intranet上也可以通过。但是对于面向公众的应用程序,随着流量的增长,您将绝对杀死服务器。
Brightball

4

为什么不考虑使用Web套接字而不是长时间轮询?它们非常高效且易于设置。但是,仅现代浏览器支持它们。这是一个快速参考


我认为,一旦Websocket在所有地方(可能不会在未来几年内)实现,它们将成为此类应用程序的标准。不幸的是,目前,我们不能依靠它们来生产应用程序。
理查德

3
@Richard但是,您可以使用类似Socket.IO提供自动回退传输,提供网络插座一样的功能一路下降到IE 6
布拉德



2

您可以尝试icomet(https://github.com/ideawu/icomet),这是一个使用libevent构建的C1000K C ++彗星服务器。icomet还提供了一个JavaScript库,使用起来非常简单

var comet = new iComet({
    sign_url: 'http://' + app_host + '/sign?obj=' + obj,
    sub_url: 'http://' + icomet_host + '/sub',
    callback: function(msg){
        // on server push
        alert(msg.content);
    }
});

icomet支持多种浏览器和操作系统,包括Safari(iOS,Mac),IE(Windows),Firefox,Chrome等。


0

最简单的NodeJS

const http = require('http');

const server = http.createServer((req, res) => {
  SomeVeryLongAction(res);
});

server.on('clientError', (err, socket) => {
  socket.end('HTTP/1.1 400 Bad Request\r\n\r\n');
});

server.listen(8000);

// the long running task - simplified to setTimeout here
// but can be async, wait from websocket service - whatever really
function SomeVeryLongAction(response) {
  setTimeout(response.end, 10000);
}

Express中的生产明智方案,例如您将response在中间件中获得。您是否需要做的事情,可以将所有长期轮询的方法扩展到Map或其他对象(其他流程可以看到),并<Response> response.end()在准备就绪时调用它。长时间轮询的连接没有什么特别的。其余就是您通常构建应用程序的方式。

如果您不了解搜寻范围是什么意思,这应该能让您了解

const http = require('http');
var responsesArray = [];

const server = http.createServer((req, res) => {
  // not dealing with connection
  // put it on stack (array in this case)
  responsesArray.push(res);
  // end this is where normal api flow ends
});

server.on('clientError', (err, socket) => {
  socket.end('HTTP/1.1 400 Bad Request\r\n\r\n');
});

// and eventually when we are ready to resolve
// that if is there just to ensure you actually 
// called endpoint before the timeout kicks in
function SomeVeryLongAction() {
  if ( responsesArray.length ) {
    let localResponse = responsesArray.shift();
    localResponse.end();
  }
}

// simulate some action out of endpoint flow
setTimeout(SomeVeryLongAction, 10000);
server.listen(8000);

如您所见,您可以真正响应所有连接,一个,随心所欲。有id每个请求,因此您应该能够使用map并通过api调用访问特定的请求。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.