因此,执行故障排除步骤(假设您每次都停止操作并等待问题再次出现):
- 检查交换机上的日志,看看它是否告诉您为什么使用100M。
- 如果您仍在运行它,请关闭Joel一直在推销的那种极其有害的“ Windows负载平衡”废话-它的工作方式是通过破坏交换机的缓存,强制其对每个数据包进行软件处理。您的交换机被设计为在硬件中转发数据包,并且仅具有CPU所需的功能即可确定未知流量必须采取的物理路径(输入-> asic->输出),并对硬件进行编程以实现此目的(请阅读:计算器的CPU比您的交换机更好,请不要做一些愚蠢的事情,否则会使您的交换机的CPU更加努力地工作)。Windows负载平衡的工作原理是由您的交换机做出决定并为每个数据包重新安装硬件缓存。那可能无法解决这个特定问题,但是它使我从播客中感到烦恼……抱歉。
- 确保配置在两侧都匹配-听起来像您已经完成了
- Google针对您的交换机上的autoneg错误-除非您自己构建它,否则您不是唯一一个尝试对正在使用的交换机运行autoneg的人
- 用额定为Cat5e或更高的电缆替换电缆-理想情况下,您知道的电缆可以工作,就像工作站插入的电缆一样。不要尝试使用Cat5或其他人制造的垃圾,请使用包装中实际模制末端的容器。
- 移动端口-将服务器放在同一交换机的其他端口上
- 更换网卡-使用在不同时间订购的不同批次
至此,您已经取消了配置,所插入的物理端口以及它们之间的电缆连接。如果这种情况仍在发生,则其他一些原因可能是:
- 电缆布线-小心交流电源电缆的EM干扰,将其布线到机架的不同侧。
- 冷却-确保您的环境温度不超过90度,并且NIC卡没有掉入某种“亲爱的上帝,请让我转发这个数据包”模式。我听说过但没有见过,例如,思科路由器在过热时会停止进行快速交换并通过CPU转发数据包。
- 用不会吸引人的东西替换交换机-检查主机每秒正在谈话的带宽总量,然后查看交换机的额定背板容量。例如,潜在的48台中的7台主机全部传输1.0G足以停止Cisco 3750。另外要非常小心的小气鬼也-RAN网络供应商:d-Link的,Linksys公司,戴尔,英特尔,惠普。没有人认真对待网络使用这些人,不是因为“没有人因为使用Cisco而被解雇”,而是因为“人们记得拥有20/48端口的Intel交换机在两年内出现故障”或“我曾经专门使用ProCurve和在我真正使用思科之前,我一直都在谈论思科是多么邪恶。思科被认为是中端产品网络供应商,那么这能告诉您有关Cisco 以下人员的信息吗?:-)
背景/为什么我的回答是最出色的:我是金融行业的网络/系统工程师,以下是我对小型全球网络(15个分支机构,8个数据中心)的经验:
我们所有的LAN端口都是autoneg,因为我们在两端都控制设备,并且对双方都有某种访问权限-这可能很简单,就像与某人通电话并让他们检查设置一样。三年来,我只有一次内部端口由于autoneg失败而失败,那是由于电缆损坏-在更换电缆后它消失了。
在前辈在其NIC上硬编码100 / full的情况下,我们遇到了更多的问题,而没有记录这一事实。在下一个维护窗口将所有内容重置为自动/自动,此后再没有任何问题。
在我们从WAN运营商那里获得铜移交的几个地方?您几乎应该一直希望铜缆WAN / Internet连接一直处于故障状态-部分原因是您不知道另一端是什么。一些古老的Extreme交换机碰巧具有错误的固件,无法进行自动协商,但是MPLS标记吗?一些$ 5的媒体转换器,因为您的ISP的$ 200k Ciena边缘设备太强大了,无法在双绞线上提供以太网吗?事先确定要如何处理并坚持下去,然后期望运营商内部的一些变态在星期六晚上10点进行更改,因为商定的配置从未被记录下来,并且他们有一些政策可循。
认真地,但是,请从您的ISP获得光纤切换。