7
服务器机房中有东西在燃烧。如何快速识别它是什么?
前几天,我们注意到服务器机房发出强烈的燃烧气味。长话短说,它最终成为UPS单元中正在燃烧的电池模块之一,但花了好几个小时才能够弄清楚。我们能够弄清楚的主要原因是,UPS显示屏最终显示需要更换模块。 问题出在这里:整个房间充满了气味。进行嗅探测试非常困难,因为气味已经渗入所有东西(更不用说它使我们头昏眼花了)。我们几乎错误地关闭了生产数据库服务器,因为它是最臭的地方。活力似乎还不错(CPU温度显示60摄氏度,风扇速度也不错),但我们不确定。碰巧的是,烧坏的电池模块与机架上的服务器的高度大致相同,并且只有3英尺远。如果这是真正的紧急情况,我们将惨败。 实际上,实际的服务器硬件被烧毁的机会很少发生,而且在大多数情况下,我们将UPS视为罪魁祸首。但是,如果使用带有多个设备的多个机架,它很快就会成为一种猜测游戏。如何快速准确地确定实际上正在烧毁的设备?我意识到这个问题在很大程度上取决于环境变量,例如房间大小,通风,位置等,但是任何输入都会受到赞赏。
454
hardware