固件最佳做法和更新时间表


12

固件很少涉及更新。眼不见,心不烦。

许多设备:RAID控制器,NIC,芯片组,甚至硬盘驱动器,都可以从更新中受益。更好的功能,安全性/错误修复等。

大多数SA都说:“每当出现故障时,请更新固件。” 但是,这可能会带来很多困难。有几次,当与Dell联系有关硬盘驱动器发生故障时,有人询问我的硬盘驱动器固件是否是最新的。我所有的服务器都使用某种类型的RAID配置。如果我已经有一个驱动器出现故障,我是否应该考虑尝试升级其余驱动器或RAID控制器上的固件?我会说不。但是戴尔似乎有不同的看法。

  • 什么是系统固件的实际更新时间表?
  • 您有什么最佳做法可以分享吗?

(我知道Dell有一个很好的实用程序,称为Server Update Utility,它可以检查任何Dell服务器上的所有新固件。)

Answers:


10

我在两个关键实例中更新固件。

  1. 升级服务器时。
    • 当我刚拿到服务器时,我将在HP网站上查看其最新“固件更新CD”的日期。如果足够新,在将它投入生产之前,我将在服务器上运行它。
    • 重新调整服务器用途时。通常,该服务器的使用时间为2-5年,并且可能在整个时间内都没有进行固件更新。由于无论如何都要重新格式化,因此我将更新服务器上的所有各种固件。
  2. 如果有供应商确定需要这样做。
    • 有时会发现主要的稳定性问题,例如在错误类型的故障后无法重建RAID5阵列,或者NIC上TCP卸载引擎中的主要性能错误。
    • 有时,在寻求支持时,支持技术人员会要求我更新固件。那我会这样做。

我没有在上面列出第三个实例,因为它尚未发生:

  • 将较新的组件放入旧服务器时。有时系统BIOS需要更新才能处理。

我认为这达到了极好的平衡。
约瑟夫·科恩

5

我们使用HP SIM(系统的Insight Manager)推出固件,我们按平台进行操作-首先进行测试,然后进行开发,然后进行集成,然后参考,最后进行生产-通常每个平台大约一周左右,因此我们获得5/6一周发布到生产窗口。似乎可以正常工作,但我们从未做过的一件事就是与其他更新(例如驱动程序/代码等)同时推出固件-节省了很多麻烦。


+1,指责,太普遍了……似乎每个星期二……
Joseph Kern 2009年

4

我可能在这里反对这种说法,但是如果它没有被破坏,那就不要修复它。如果不是安全问题,那我就别说了。

出于这个原因,我从来没有拒绝过戴尔的服务。

也许您可以每月计划一次实用程序,然后通过其他重启来更新它们?


+1为讲真话。如果没有充分的理由进行升级(例如除非更新BIOS /固件,否则供应商将不再支持您的套件),那么为什么要这样做呢?
RainyRat

我无法使用Dell支持,但我仍然遇到一个问题,直到更新我的BIOS,英特尔才会支持它-只有我无法更新该更新的东西,有时我想知道是否是因为唯一可用的更新我的服务器正在运行的更新版本太多。
Ben Dunlap

1
原则上,我同意您的看法,但是我们有些服务器现在的速度和稳定性要比购买时快得多,这完全是由于固件改进所致。
Chopper3 2009年

同意 我猜在这种情况下,性能问题可以视为“中断”。
MathewC

作为记录,最近我实际上让戴尔拒绝了PowerEdge服务器上的硬盘更换,直到我将RAID控制器固件更新到最新版本为止。
Ryan Bolger

4

您应该像处理补丁一样对待固件更新,尽管这些更新通常较难部署,因此您可能需要查看发行说明以帮助确定是否值得付出努力(但同样,您也可以对补丁进行此操作) )。 固件更新与修复新错误一样可能包含新的令人讨厌的错误。

调试(或重新调试硬件)时应完成固件更新,因为这样做很容易。

部署应大致遵循以下原则:

  1. 在实验室机器上测试
  2. 部署到不重要的系统
  3. 等待
  4. 部署到重要/生产系统

再说一遍,有些事情无法跟上。尤其重要的是,非常迅速地将Microsoft补丁发布到Windows桌面非常重要,而且如果没有大量资源,很难快速进行测试。


2

在调试任何新的基础结构设备时,通常会更新固件。仅当存在特定问题(例如必需的错误修复或安全问题)时,工作站和打印机才会更新。对于服务器而言,它的重要性不那么重要,因为在大多数情况下,固件代码要么无法在启动过程中执行,要么就这么简单,几乎不会出错。

我在升级服务器上的RAID固件方面遇到了不好的经验,因为许多制造商不保证如果固件版本更改,则当前RAID配置将是可行的,阵列中的单个磁盘也是如此。

我的倾向是在大多数情况下采用“如果没有破裂,就不要修复”的政策。值得检查的是,是否有可能从错误的Firemware升级中恢复(例如,HP服务器中的冗余ROM,或者您是否具有EEPROM闪存并且愿意将其用作可移动芯片)。


您多久检查一次所有不同固件上的“安全问题”?
Joseph Kern

实际上,我们的所有套件都是HP,通过注册该产品,我注册了一个通用帐户来解决“有关固件,驱动程序和安全性的通知”问题,如果我离开了,我会将该帐户重定向到我的继承人。
理查德·斯莱特

2

我不能说戴尔,但是很多年前,IBM存储团队内部的人告诉我,RAID固件的第一级从来都不是性能最好的。他们首先追求稳定性,然后根据未来的转速提高性能。不幸的是,除非有问题,否则我们很少有人会想到(或者也许会成为骗子)稍后再使用健康系统的RAID固件。因此,我们的策略是在每次设置新服务器时都升级RAID固件级别,前提是RAID适配器不是spankin的新型号。这样,我们至少可以获得当时最佳的性能水平。如果它是新模式的适配器,我们会尽力记下几个月的时间并检查更新,但是我们对此并不虔诚。

在主板上,除非供应商技术支持告知我们,否则我们请勿将它们弄乱。多年来的经验表明,除非存在需要解决的特定问题,否则风险将远远大于难以衡量的收益。

// spk


1

我已经成功使用了SUU和HP和IBM的类似产品。我遇到的唯一问题是,由于某种技术原因,使用供应商驱动程序替换Dell驱动程序时,导致SUU升级失败,导致Dell服务器上的OM升级失败。我们每年至少两次在数百台服务器上运行固件和驱动程序的更新,以使它们始终保持最新状态。我们从未遇到RAID固件问题。


告诉我更多...
Joseph Kern 2009年

我认为我们会按季度发布Dell版本,以安排更改以应用更新。我们会将它们应用于我们支持的所有客户端中的所有Dell计算机。也许我们很幸运,但是遇到的问题很少,我认为这也归结为制定计划和保持最新状态。当我们使用新服务器时,我们要做的第一件事就是将所有商品提高到当前水平。
米奇2009年

1

我们会尽一切可能更新固件,遗憾的是,对于某些系统,固件可能每年更新3-4次(主要维护时段)。


0

如果您阅读了Dell固件升级随附的摘要,您会发现它将更新分类为关键,重要或其他内容,并描述了升级修复的内容(并不总是如希望的那样清晰!)。

我的观点是,如果没有充分的理由,我将不会进行固件升级。如果这是关键更新并解决了一个问题,那么我很有可能遇到,那么,即使这是一项压力很大的工作,我也会予以应用。

正如您所说,戴尔支持通常会在支持您之前坚持应用任何相关的升级,显然,在这种情况下,您没有太多选择。您可以了解Dell不想浪费工程师的时间,即使我不知道固件是造成支持电话的原因。

JR


0

我认为这取决于您必须处理的环境类型。如果您在要求高可用性的环境中工作,并且无法在需要时重新引导服务器。我认为最佳实践是执行维护计划。为每个系统选择一个时间范围,通知用户并在此分配的时间范围内执行所有必要的工作,包括固件更新。这样,您可以确定所有系统都是最新的,并且可以将对生产的影响降到最低。同样,如前所述,在构建新服务器时,有必要检查固件更新。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.