HP ProLiant DL360 G7挂在“电源和热校准”屏幕上


41

我有一个新的HP ProLiant DL360 G7系统,该系统显示出难以重现的问题。在POST过程中,服务器会随机挂在正在进行功率和热校准...屏幕上。通常在从已安装的操作系统进行热启动/重新引导之后。

在此处输入图片说明

此时系统将无限期停止。通过ILO 3电源控件发出复位或冷启动,可使系统正常启动而不会发生意外。

当系统处于此状态时,可以完全访问ILO 3界面,并且所有系统运行状况指示灯均正常(均为绿色)。该服务器位于气候受控的数据中心中,该数据中心具有与PDU的电源连接。环境温度为64°F / 17°C。在部署之前,将系统置于24小时的组件测试循环中,并且没有任何故障。

该服务器的主要操作系统是VMWare ESXi5。我们最初尝试使用5.0版本,然后尝试使用5.1版本。两者都是通过PXE引导和kickstart部署的。此外,我们正在测试裸机Windows和Red Hat Linux安装。

HP ProLiant系统具有一组全面的BIOS选项。除了静态高性能配置文件外,我们还尝试了默认设置。我已经禁用了启动启动屏幕,并且此时与上面的屏幕截图相比,光标只是闪烁了一点。我们还尝试了一些用于BIOS配置的VMWare “最佳实践”。我们已经从HP收到了一个忠告,忠告似乎概述了类似的问题,但没有解决我们的特定问题。

怀疑硬件问题,我让供应商将相同的系统发送给同一天交货。新服务器是完全相同的构建,磁盘除外。我们将磁盘从旧服务器移到了新服务器。我们在替换硬件上遇到了相同的随机引导问题。

我现在有两个服务器并行运行。该问题在热靴上随机出现。冷靴似乎没有问题。我正在研究一些更深奥的BIOS设置,例如禁用Turbo Boost或完全禁用功率校准功能。我可以尝试这些,但是没有必要。

有什么想法吗?

- 编辑 -

系统细节:

  • DL360 G7-2个X5670六核CPU
  • 96GB RAM(12 x 8GB低压DIMM)
  • 2个146GB 15k SAS硬盘驱动器
  • 2个750W冗余电源

所有用于ProLiant DVD的HP Service Pack上最新的固件。

我曾提到过调用HP并拖曳interwebz,但有提到ILO 3交互不良的情况,但这也发生在物理控制台上的服务器上。惠普还建议使用电源,但这是在成功为其他生产系统供电的数据中心机架中。

低压DIMM与750W电源之间是否存在交互不良的可能性?该服务器为受支持的配置。


2
有什么方法可以消除磁盘的可能原因?您是否有机会使用某些备用SAS或SATA磁盘进行测试?
ErnieTheGeek

是的,已经在第二个系统中使用一组已知良好的磁盘进行了测试。他们正在并行运行。
ewwhite

1
我唯一见过的是在一个系统(也是DL360 G7)中,我试图使用非HP卡来提供存储。当我同时拥有SmartArray卡和另一张卡时,它做到了。当我取出其中一个时,它过去了。这不是您的问题,但我会继续讲下去。
sysadmin1138

1
可能与网络有关?尝试复制而不连接到网络。
ErnieTheGeek

1
@TheCleaner禁用动态功率封顶在G7服务器上不是一个选项。它是针对Gen8 ProLiant系列推出的。
ewwhite

Answers:


43

因此,在将第三个系统引入混合系统并遇到相同的问题之后,我们开始质疑环境。我挖了一份《HP ProLiant服务器故障排除指南》,并找到了如下所示的POST问题流程图。

在此处输入图片说明

仔细地执行图表中的步骤,我们意识到所有服务器上的一个常数是连接到数据中心崩溃推车的KVM切换器。这是支持USB的消费类KVM。根据流程图中突出显示的节点,您是否知道良好的KVM?,我无法下定论。

因此,我们从KVM交换机上拔下了服务器的插头,并运行了自动启动,sleep 300; reboot顺序为rc.local。无论正常的DIMM,低压DIMM,PSU功率如何,服务器都不会出现此问题。

这都是与USB KVM切换器互动不良的结果。由于这是控制台,因此可以确保我们在寻找故障时都能看到故障。自我实现...


2
哇,真是个好人!很高兴您对此表示怀疑。
nedm

7
乌鸦 +1提问和回答。做得好 我可能会忽略这一点。“已知好”?当然,众所周知,这很好-是有效的,不是吗?
mfinni

非常感谢你!!!绝对是KVM。只需断开视频并直接插入监视器,服务器即可再次正常运行。操作系统加载后,我将KVM重新插入。我认为问题是由我不小心触摸服务器背面的电缆引起的。系统停止并且仅对此建议作出反应。

1
知道KVM如何导致这种情况吗?
TheLQ 2013年

@TheLQ廉价的消费级KVM设备是这里的原因。键盘可能也有问题。
ewwhite
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.