ECC Chipkill错误:哪个DIMM?
我们经常使服务器中的DIMM损坏,并在syslog中出现以下错误: 5月7日09:15:31 nolcgi303内核:EDAC k8 MC0:通用总线错误:参与处理器(本地节点响应),超时(无超时),内存事务类型(通用读取),mem或i / o(mem访问) ,缓存级别(通用) 5月7日09:15:31 nolcgi303内核:MC0:CE页面0xa0,偏移量0x40,纹理8,校正子0xb50d,第2行,通道0,标签“”:k8_edac 5月7日09:15:31 nolcgi303内核:MC0:CE-无可用信息:k8_edac错误溢出设置 5月7日09:15:31 nolcgi303内核:EDAC k8 MC0:扩展错误代码:ECC chipkill x4错误 我们可以使用HP SmartStart CD来确定哪个DIMM出现错误,但这需要使服务器停产。在服务器启动时,有什么巧妙的方法可以解决哪个DIMM出现故障吗?我们所有的服务器都是运行RHEL 5的HP硬件。