WAN上何时有流量,什么会导致高延迟?


16

我的网络的互联网速度一直很慢。经过大量的故障排除后,我确定所有流内容/下载都将导致WAN流量的延迟激增。

例如,在无负载的情况下,我在30ms左右ping 8.8.8.8。如果我在同一台计算机上开始流式传输YouTube,则延迟会跳到500毫秒左右,相差约400毫秒。如果我关闭视频,等待时间将返回30ms。但是,如果我在同一LAN上有一个用户开始播放pandora,则问题会再次出现。

我的网络运行了一个10/100交换机。交换机直接连接到DSL路由器。我通常有6Mb的连接。

在故障排除中,我已完成以下操作:

  • 从数个工作站的Wireshk进行扫描,以查找错误的数据包。(我会包括在内,但扫描过程中会包含机密信息)。没有任何异乎寻常的地方。
  • 用升级的型号替换路由器,然后升级固件。
  • ISP是否提高了速度,该速度在speedtest.net上正确测量(降低10,提高1.5)。问题是完全一样的。
  • ISP换掉了卡的末端,以防万一它们的硬件/端口不好。
  • 在另一个办公室使用完全相同的ISP /软件包进行了测试。让多台计算机在不影响延迟的情况下以1080p和pandora流式传输YouTube。
  • 关闭除一台计算机外的所有计算机,晚上在没有用户在那里的情况下运行。
  • 受监控的LAN流量,永远不会遇到延迟问题。

我知道,如果我达到带宽极限,或者某些硬件的速度出现瓶颈,则将导致此问题。但是,似乎根本不是那样。几乎所有通过WAN的流量都会增加延迟。即使我几乎将连接速度提高了一倍,问题仍然相同。当我让两个用户使用pandora并进行了几次冲浪时,互联网一无所有(丢弃的数据包,页面无法加载)。我家里有一半的连接,而同时进行的netflix / youtube / pandora流式传输甚至都没有达到我的5 Mb。

问题:什么时候通过WAN传输流量会导致高延迟?


1
这个问题涉及广泛的领域,您正在谈论的是对网络进行故障排除并查找问题。问题应该更具体。顺便说一下,这与wireshark无关(如您的标签所述)。就是说,欢迎来到网络工程;)
Bulki

有什么答案对您有帮助吗?如果是这样,您应该接受答案,这样问题就不会永远弹出来寻找答案。或者,您可以提供并接受自己的答案。
罗恩·莫平

Answers:


10

这听起来像某种形式的“ 缓冲膨胀 ”,可能是在DSLAM / LNS上执行6Mb速率限制的部分。

可能是您的CPE盒子,但是可能性很小。


+1可能是ISP上某些配置不当的速率限制或整形,但也可能是CPE质量较差(或出现故障)。我已经看到速率为40Mbps的CPE开始以10Mpbs的速度翻倒,因为它们不能处理高pps速率。高pps速率的小数据包确实使它们紧张。
jwbensley

哦,我还没有看到他取代了CPE。我错过了要点!
jwbensley

9

我会验证延迟发生的位置。使用MTR之类的工具检查每个跃点的延迟。MTR将每个跃点的ping统计信息与跟踪路由结合在一起,可以极大地帮助缩小此类问题的范围。

在Linux上,该命令为mtr 8.8.8.8,并且该工具还有Windows版本

输出将显示延迟在哪里开始。如果它在ISP网络上,则可以将输出转发到ISP并帮助他们使用它来解决其网络问题。

如果延迟在您的网络内部开始,那么您也可以自己缩小问题的范围。


1
是否有可用于Cisco IOS设备的mtr版本?我知道它可以从Junos CLI
DrBru

5

检查DSL线路统计信息。(交错式与快速路径,错误计数器等)

在不同位置的测试测试了不同的线路,可能是在不同的DSLAM上。这表明不应该归咎于ISP基础架构。强烈建议您的DSL线路出现故障。DSLAM本身可能很拥挤,但是您很难像预期那样反复地将其推到生产线上。

如果ATM信元被破坏(大多数DSL的传输),您将看到这样的严重减速,因为必须重新发送整个帧。


3

每当我遇到客户遇到网络延迟的情况时,要做的第一件事就是检查网络中的每个单独连接。通常,只有一个设备会出现瓶颈。

如果网络使用率较低,我将完全禁用除互联网连接设备以外的所有设备的QoS(因为QoS会降低交换环境中的流量)。

在您的数据包捕获中,我将进行I / O分析,并查看您是否在任何地方都处于高原。这可以指示突发流量,这将导致排队,这将延迟数据包的传递或完全摆脱数据包。

遇到问题时,我还将检查每个设备的CPU。如果看到CPU跳升,则可能是您的问题设备。还要检查日志,看是否有任何错误。

另外,我将确保所有连接都以全速(速度100全双工)进行协商。

另外,请尝试禁用所有防火墙或安全服务。


2

另一件事要看的是您的交换机和DSL调制解调器之间的连接。您描述的症状几乎听起来像是两者之间存在双工不匹配。

排除交换机的另一种方法是完全卸下交换机,并使用直接连接到DSL调制解调器的一台计算机测试连接。


2

高流量时的高延迟/不良吞吐量有时表示L1问题(双工不匹配/电缆不良/光纤不干净)。您是否检查出不是这种情况?


0

这会成为上游的瓶颈吗?不知道您在世界的哪个角落,但是ISP的国际带宽可能很糟糕。Speedtest.net将默认为最近的服务器。


0

我使用的一种简单方法是traceroute函数,该函数查找跟踪中的高响应时间并检查系统是否存在硬件故障,DOS攻击,QoS错误分类等。当然,您需要访问路径中的所有设备。自从我在一家电信公司工作以来,这段时间对我来说很轻松。


0

您要在哪个操作系统上进行测试?如果是Windows,默认情况下会安装“ QoS数据包计划程序”服务并将其绑定到网络接口。它将根据网络堆栈的基础设置启动,并主动延迟未归类为“多媒体”的任何流量。

尝试从界面中将其删除,然后重新检查结果。

或者更好的是,正确地重新配置它:http : //www.dslreports.com/faq/3688


0

根据我的经验,我会补充说某些ISP会以最低的优先级来处理ICMP数据包。发生一次,每次我启动youtube时,“请求都超时”。

在开始播放视频之前和播放视频时发布winmtr。开始第二流,让我们看看这将如何影响ICMP数据包和第一视频。


0

如果您通过10/100交换机进行连接,并且部分进行了自动协商,则可能是双工不匹配。当网络上的负载相对安静时不会显示时,这将导致频繁的冲突。冲突将导致重发,并迫使通信退回,并可能导致看似不合理的减速。


0

抱歉,无法恢复旧线程。OP写道:

...几乎所有通过WAN的流量都会增加延迟...

这些是Bufferbloat的确切症状。路由器可能会排队过多的流量,并且使小流量饿死(这是提供响应能力所必需的)。

您的路由器需要一种缓解“负载延迟”问题的方法。您可能无法使用QoS,但这需要大量配置和不断调整。

自从OP以来,技术水平已经提高,因此请查找Bufferbloat,AQM,CoDel,fq_codel,Cake,PIE或其他技术。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.