我的思科交换机端口坏了吗?


9

在过去的几天中,我一直在为内部网络上的少数最终用户追寻丢包和网络稳定性的问题……这些问题上周浮出水面,但六周前的位置却被雷电击中

我看到在77米长的另一端,四台Cisco 2960与几台PC和电话之间出现5-10%的数据包丢失。PC通过中继线与电话串联运行(交换端口配置pastebin)。我们看到客户端服务器应用程序和Microsoft Exchange连接中的通话中断和中断。

我远程尝试了常规的故障排除步骤,请本地技术人员在用户和生产活动中断期间执行以下操作:

  • 更换墙壁插孔和设备之间的电缆。
  • 更改配线架和交换机端口之间的配线电缆。
  • 尝试使用2960堆栈中的其他交换机端口。
  • 使用已知良好的设备(新手机,不同PC)更改最终用户设备。
  • 清除交换机端口接口计数器并密切监视增量错误。(的Pastebin输出sh int
  • 遍历设备日志和Observium RRD图。在交换机侧没有链接上/下的问题。
  • 更换最终用户侧的电源板。
  • 使用test cable-diagnostics tdr int Gi4/0/9(干净)* 从Cisco 2960测试电缆
  • 测试电缆与Tripp-Lite电缆测试仪一起使用。(清洁)
  • 在交换机堆栈成员上运行诊断。(清洁)

最后,交换机端口需要进行三处更改才能找到稳定的解决方案。唯一合乎逻辑的结论是,几个Cisco 2960交换机端口有问题或不稳定...没有死,但行为也不相同。我不习惯看到单个端口以这种方式消失。

我还能测试或检查什么以确定这些设备是否损坏?

验证这一点的最佳做法是什么?

单个端口而不是连续的端口出现问题是常见的吗?


顺便说一句- show cable-diagnostics tdr int Gi4/0/14非常酷...

Interface Speed Local pair Pair length        Remote pair Pair status
--------- ----- ---------- ------------------ ----------- --------------------
Gi4/0/14  1000M Pair A     79   +/- 0  meters Pair B      Normal              
                Pair B     75   +/- 0  meters Pair A      Normal              
                Pair C     77   +/- 0  meters Pair D      Normal              
                Pair D     79   +/- 0  meters Pair C      Normal              

您可以添加“ show interface gi4 / 0/9” ...还是您的tdr输出是gi4 / 0/14 ...多少个端口有问题?
Mike Pennington

@MikePennington 48个界面中的4个显示问题。计数器已清除。但是唯一增加的计数器是:Total output drops: 1461
ewwhite

从总共1461个丢包中输出了多少个数据包?所有四个问题端口是否都显示输出下降?
Mike Pennington

@MikePennington 接口,其中两个故障端口的pastebin输出
ewwhite 2012年

1
不是技术性的答案,而是..您是否有有效的TAC合同?如果是,请参与:P
itsGC 2012年

Answers:


7

虽然端口组通常共享一个ASIC,但每个端口都必须具有自己的独立PHY。如果PHY已损坏,则其邻居可能没有问题,这很可能会产生问题。

也就是说,输出下降是物理问题的奇怪症状-并非不可能,但不是典型现象。尽管有半双工链路,但输出丢失通常与缓冲区耗尽有关,而不是物理问题。

您可以通过在电线的另一侧设置数据包捕获来获取更多信息。不良的PHY可能会在链路的一侧或两侧出现一些物理层错误(不良的CRC,欠幅/巨基等)。

总而言之,听起来您已经淘汰得足够多了,可能已经超出了收益递减的范围。如果您有合同,我建议您使用RMA。


由于这是在多(2)台交换机的多个端口上发生的,但仅针对一小部分用户,是否需要替换所有四个交换机?我只是有更换很难游说不知道的核心问题,因为更换将需要大量的停机时间,重新布线等。
ewwhite

闪电是一种非常奇怪的动物,它所造成的损害会在以后以无法预测的方式显现出来。当然,停机时间很糟糕,但是可以通过循环插入替换开关,移动补丁并拉出旧补丁来在某种程度上缓解停机时间。我希望有一个更简单的答案,但是如果您将问题隔离在几个端口上,则没有其他事情要做。
rnxrx 2012年

如今,PHY几乎总是集成到ASIC中。平价便宜。磁性元件是它们真正无法集成到ASIC中的唯一部分,它可能会损坏,但这不是PHY。另外,使用四极组磁性装置是很常见的,因此,如果问题出在4个端口上,则可采用该理论。
克里斯S

并非如此-如果您了解大多数Cisco交换机(包括所讨论的交换机)的体系结构,则通常将相同的ASIC用于一两个光纤或铜缆GE或一组100TX。在片上交换架构中,有更多的功能转移到了ASIC上,但在那些情况下,仍然有物理层由可插拔的光学器件或某种铜介质处理。既然同一个ASIC复合体通常可以处理许多不同的速度和功率要求,那么将该功能集成到同一个自旋中就没有多大意义了?
rnxrx 2012年

最后,在太多端口降级到无法使用之后,更换了所有交换机。最后,SmartNet的好用法!
ewwhite

2

是的,单个端口可能不好,但正如我记得,您必须更换整个模块。(注意:自从我完成了重要的Cisco工作以来已经很长时间了……)

我不确定是否有帮助,但请查看Etsy的Ops工程师之一Laurie Denness的FITB

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.