停靠时可能使用WiFi和以太网进行网络环路


0

我一直看到一个奇怪的问题,我不能按需复制,并怀疑根本原因。

问题:整个网络断断续续,直到我四处走动并拔掉导致生成树泛滥的计算机。

拓扑:我有2个思科非托管千兆交换机通过千兆位gbic连接。两个交换机都有未被占用的千兆位gbic端口旁边的相应端口,因此上行链路按设计运行。两个交换机都是思科和同一系列(SG100和SG102),因此不是不兼容的问题。

我已经将一个wirehark捕获直接连接到罪魁祸首机器以及通过交换机连接,并且BOTH产生相同的生成树洪水,导致MAC PAUSE帧减慢因为杀死网络的东西。

Probable culprit but unable to replicate issue "YET" is that this seems to usually occur AFTER the following occurs:
1. User undocks their laptop from their docking station and connects to WiFi
2. User is done with need for laptop away from desk and re-docks
3. User's laptop re-connects via Ethernet on the docking station
4. Sometimes crashes entire network.

由于我无法按需复制问题,我怎样才能为Wireshark构建某种类型的过滤器,以便仅捕获类似于回声(非ICMP ECHO)的数据包更像是重复的流量,从而导致最初的风暴生长树的坚果?

这样我可以运行捕获数天或数周,直到它再次发生。以下是我在wirehark网络故障后看到的情况。

由于这些不是托管交换机,因此它们甚至不支持STP,所以我很难理解为什么它始终以生成树流量结束。此外,源MAC地址在自然配置中不存在,我只知道事后的受影响的工作站,它也总是被冻结或偶尔获得BSOD。自从我看到BSOD发生这种情况以来,已经过了很长时间,但系统每次都冻结,并且没有minidump,是的,它已经配置好了。

Other things I've already eliminated:
Cabling or cabling loop(s)
event logs - just show time loss between frozen time and reboot
no dumps when frozen
updated to Dell's latest certified drivers and BIOS
rebooted everything (again intermittent but usually after a undock, connecft to WiFi, re-dock and auto connect to ethernet pattern)

在此输入图像描述

Answers:


0

首先,为了清楚起见,这不是生成树协议(IEEE 802.1D),这是以太网流量控制(IEEE 802.3x,现在是IEEE 802.3-2012的一部分)。以太网流量控制PAUSE帧被寻址到STP使用的相同地址之一,因此数据包嗅探器通常将该地址报告为STP地址,即使它被用于流量控制也是如此。

以太网流量控制的802.3x时代是一种破灭。它被发现太晚了,它可能会导致网络问题,特别是“线头”阻塞。想象一下快速服务器向普通客户端和慢速客户端提供数据。慢速客户端不堪重负向交换机发送PAUSE帧,现在交换机无法提供从服务器获取的所有帧,因此交换机将PAUSE帧发送到服务器。这会阻止服务器将帧发送到另一个(普通)客户端,即使服务器,交换机和客户端都具有备用容量。这个缓慢的客户端(以及一个非常明亮的交换机和不太明亮的802.3x以太网流量控制协议)为每个人搞砸了。

因此,一些交换机厂商故意不支持802.3x风格的流量控制,或者如果它们完全支持它们,它们只让交换机尊重传入的PAUSE帧,但绝不发送它们。如果您的交换机完全可管理,并且具有流量控制的配置设置,请确保它们配置为永不发送PAUSE帧。

事实上,鉴于您正在看到PAUSE帧洪水,如果您一起禁用流量控制,您的网络可能会更好。配置交换机和客户端以禁用流量控制。

此外,让您的以太网驱动程序保持最新状态,并考虑清除您的网络中任何已知的以太网网卡,当主机崩溃时,该网络会使用PAUSE帧向网络发送垃圾邮件。


这是有道理的,而且我曾经有一次能够复制这个问题,但是在我完成捕获之后它又发生了,因此错过了最初的原因。在接过客户端并从笔记本电脑底座弹出,连接WiFi,重新对接并重复几次后,我能够关闭网络。当我抓捕并且无法在行动中抓住它时,我再次尝试这样做。所有系统都是i7 Sandybridge Extreme触发器或更新的16-32GB内存和三星840 Pro SSD,服务器是中档,但今天我测试时只有2人。
布拉德2015年

我最好的猜测是当笔记本电脑在WiFi和以太网上多宿主时发生的事情。当我在对接/取消对接并连接到WiFi时,我在DHCP中看到了客户端的IP,并希望在wireshark中看到更明显的东西。此外,当PAUSE帧发生疯狂时,任何来自它的机器都会被冻结,但当我冷启动它时,系统上没有任何记录。没有日志或转储,所以除了网络故障的症状之外,我没有别的东西可以看。
布拉德2015年

@Brad您可能无法在数据包跟踪中找到初始原因。它可能与双宿无关。它可能类似于:1)可能与网络完全无关的东西(但在停靠/取消停靠期间发生)会使Windows死机(冻结/ BSOD)。2)由于Windows死机,以太网驱动程序不再从以太网芯片读取帧,因此以太网芯片的缓冲区不会耗尽,因此以太网芯片开始为它看到的每个输入帧发送PAUSE帧。3)越野车开关不过滤PAUSE帧,将它们发送到所有端口。
Spiff 2015年

有道理,交换机是不受管理的,但是对于以太网芯片开始广播PAUSE,是不是需要某种类型的操作系统或驱动程序逻辑来说缓冲区已经满了这么慢?
布拉德2015年

@Brad以太网芯片现在包含很少的微控制器并运行微码。PAUSE帧几乎肯定是在该硬件级别创建和发送的。
Spiff 2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.