我遇到了一个非常烦人的问题,从现在开始的一个星期我注意到了这个问题,但找不到答案:我的网络突然停止了响应,通常恰好在25秒后返回。我使用的是内核3.10.4,现在迁移到3.11-rc4,以查看是否有所更改,但不,行为是相同的。而且由于通常的网络浏览都是“突发”并且中断完全是随机的,因此很难发现问题,因此我无法真正分辨出该问题是否也存在于以前的内核中(我一直使用custom来自kernel.org的未修补内核,全部由我自己编译)
我也不能说内核是罪魁祸首,但是我可以说系统日志上没有任何线索(我检查了两者/var/log/syslog
,/var/log/messages
并且那里也没有异常),并且硬件似乎没有问题,因为问题表明使用我的任意一张网卡:
lspci output:
02:00.0 Ethernet controller: Broadcom Corporation NetXtreme BCM5751 Gigabit Ethernet PCI Express (rev 01)
04:00.0 Ethernet controller: 3Com Corporation 3c905B 100BaseTX [Cyclone] (rev 30)
并且我已经尝试过交换以太网交换机端口,但除我以外,我工作的其他任何地方都没有问题(尽管我们使用的是类似的机器,但我是唯一使用Linux的机器,因此我不得不对此举一些臭名昭著的笑话,因为好吧...呵呵。
我在机器上运行了Wireshark,然后让它连续ping通我们的网关和同一网段上的另一台机器。然后,在出现网络故障的第一个迹象时,我将对其进行检查并验证网关是否停止响应ping,但是另一台计算机仍然在那里正常响应。其他时间是另一台机器停止响应并且网关正常,而另一些时间都停止响应。我不知道该怎么办,因此,我希望获得一些有关进一步调试的帮助或技巧,因为系统日志是完全正常的。
我有我的内核配置文件和来自wireshark的捕获文件来显示这种情况。我可以在这里或在某个pastebin网站上发布,以防万一有人觉得对理解案例有用,请让我知道我应该使用的详细信息级别(我猜没有原始数据的数据包级别就足够了)。