我有15个相同的Linux RH 4.7 64位服务器。他们运行集群数据库(集群是应用程序级别的)。偶尔(每个月左右),一个随机的盒子(虽然不一样)会冻结。
我可以ping通此框并ping通。如果我尝试在框中输入ssh,则会得到:
ssh_exchange_identification: Connection closed by remote host
SSH设置正确。
当我进入服务器机房并尝试直接登录控制台时,可以使用Alt+ 切换控制台Fn,可以输入用户名,并且会显示字符,但是按之后Enter,什么也不会发生。我等了8个小时,而且没有变化。
我设置了syslog以将所有内容记录到远程主机,这些日志中没有任何内容。当我重新启动计算机时,它可以正常工作。我已经进行了硬件测试-一切正常,日志中没有任何内容。机器还通过NAGIOS进行监控,冻结之前没有异常负载或活动。
我的想法已经用光了。我还能做什么或检查什么?