Answers:
好的,所以假设您的拓扑如下:
SW1
/ \
/ \
/ \
PC A--SW2-----SW3--PC B
由于某些原因,存在桥接环路,禁用了STP或有人在错误的地方等应用了过滤器。
PC A希望与PC B进行通信。它首先是PC B MAC的ARP,目的地是使用MAC ffff.ffff.ffff的广播。因此,帧同时进入SW1和SW3。SRC MAC是PCA。然后SW1将帧泛洪到SW3,SW3将泛洪从SW2到SW1的帧。
当第一帧进入时,SW1和SW3学习了PC A的MAC。当第二帧从相反方向进入时,它必须重新学习。由于这些事件发生得如此迅速且反复,您将看到日志消息抱怨MAC抖动。诸如“ MAC FLAP 0000.0000.0001在Gi0 / 24和Gi0 / 23之间摇摆”之类的东西。这是循环的好兆头。
然后,您可以尝试跟踪此MAC。尝试查找同一子网中设备的ARP缓存,并查看该设备具有的IP。因此,通过MAC,您可以尝试使用sh mac-address-table或IP对其进行跟踪,也许您有一个包含所有IP及其连接位置的列表。
如果主机从DHCP服务器获取IP地址,您也可以尝试在其中查找主机的来源。如果您启用了选项82,那将是一个很大的帮助。
其他迹象表明,CLI将非常缓慢。CPU负载将非常高。交换机几乎可以完成ASIC中的所有操作,因此,如果交换机的CPU负载超过50%,那可能就不好了。您应该实施SNMP监视,并注意CPU高负载。还要查找MAC摆动消息。如果开关具有环路,则LED可能会疯狂地闪烁。
您可以做的防止循环的操作:
我的一位用户最近从某人的办公桌借了一个台式机开关。返回交换机后,他们插入了附近所有松散的以太网端。这些电缆中的一根连接到网络,另一根是同一根电缆的两端。桌面交换机已插入网络,也已插入自身。交换机没有STP,因此从网络传入的广播将在另一条电缆上双向传播。当然,每次在环路端口上收到广播时,它都会被复制回到网络中。由于设计不佳,它使HSRP变得异常疯狂,并且还导致了整个园区的OSPF邻接故障。
问题的第一个迹象是转发给我电子邮件的macflap。这立即导致我们进入正确的布线室。从那里开始,这是一个基于端口LED,接口pps和日志的消除过程。不用说,此后我重新组织了整个校园。最好的预防措施可能是bpduguard。此后,我就已经部署了该功能,而且非常简单。在我的电子邮件中获得可禁用的syslog简直就是幸福。
我最近刚开始在一家公司使用其每个端口上的广播限制的公司。如果端口在广播时通过的容量大于其容量的5%,则交换机会将其置于ERRDISABLE。
storm-control broadcast level 5.00
storm-control action shutdown
当一组人倾向于插入将无线网络桥接到LAN的设备时,这可以节省生命。
尽管对于您的实际问题,我总是发现它是手动的。
如果您拥有不受管理的权限,或者具有不受管理的权限(缺少登录详细信息,或者缺乏交换机操作系统的知识等),交换机和桥接循环的情况,我将描述如何手动查找循环。这也解决了原始问题“您没有STP”的根本问题。
故障定位此循环的基本算法与STP相似,不同之处在于您不易访问带有端口ID的BPDU。
这是对环路端口的完全详尽的手动搜索。
通常,只有一对端口是环形的,这意味着彻底而安全的搜索,无需先删除所有连接的(链接)端口,然后再将它们一个接一个地重新连接。如果“树”上只有一个端口对被循环,您只需一次断开一个端口就可以找到它。
尽管如此,通用的“防污”,方法或算法已成为我上面描述的内容。
哎哟。但是好吧,我可以想到两种方法...
注意:如果交换机具有端口指示灯,则您应该能够查看哪些端口最活跃。这些是首先要看的。希望这些电缆都贴上标签,以便您可以在使用同一根电缆的两个交换机上搜索找到两个繁忙端口的低端成果。
SNMP监视:如果您具有SNMP(或类似的)使用情况统计信息,请查找最繁忙的交换机和最繁忙的端口。然后去看电缆。
...如果电缆没有标签,请在检查最繁忙的端口时开始进行跟踪和标记。
我将基于这样的理解来回答这个问题,即有关的第2层域已完全中断,并且您没有管理访问权限,因为CPU都固定了。
解决桥接环路的最佳方法是开始拔掉上行链路,直到上行链路消失为止。假设您有一个标准的交换访问层,所有访问交换机都连接到一对分布交换机中。转到第一个接入交换机,并拔掉上行链路,如果交换机端口的LED指示灯停止闪烁,那不是那个交换机,请重新插入并转到下一个交换机。重复直到您断开上行链路的连接并且LED持续快速闪烁的开关为止,这就是您的带有环路的开关。
现在,在最终用户端口上开始拔出过程,直到LED平静下来为止(如果这样做),您最后拔下的端口就是问题端口,走线并适当地惩罚用户。
我曾在美国另一端的网络上发生此问题,并不得不通过电话和我的wan链接到他们的站点来远程帮助一些一级分析师。由于他们拥有多个品牌的交换机,并且多年来逐渐将它们添加到网络中,因此问题变得更加复杂。当他们将办公室搬到办公室时,他们标记了每个端口的去向,然后以完全相同的方式在新办公室重新连接了所有设备,并启动了所有设备。不用说,少数具有有效的生成树功能的交换机不会以相同的方式收敛,并且它们具有各种循环和问题。到我完成修复工作时,发现至少有三台不受管理的交换机已与其余基础架构环路连接。
我能够追踪每个非托管交换机的方法是使用一个名为nedi的工具(在能够管理的交换机上,我启用了lldp / cdp)。我首先使用nedi生成地图。然后在地图显示从一个交换机到另一交换机的连接然后又回到同一交换机的区域,我让网络技术人员在现场手动跟踪线路。我要么手动关闭与环路相关的接口,要么让现场人员拔下电缆。最终,尽管所有疯狂的品牌转换,我都能使网络正常运行。
根据我的经验,一直是我刚插入,未关闭或添加到端口通道的电缆。更难的是别人做的并且不立即动手。