在LSI和类似RAID控制器上管理电池重新学习周期


12

工程师如何应对RAID控制器电池的“重新学习”周期?

如中所述:什么是LSI MegaRaid上的“电池重新学习”?,重新学习周期会使RAID控制器电池(BBWC或BBU)放电,从而消除了写缓存加速。检查电池寿命,充电后,将重新启用写缓存。在重新学习周期的持续时间内,这对服务器I / O性能有明显影响。我认为这每月发生一次。

已经注意到性能下降,尤其是在数据库系统上:

数据库慢?检查RAID电池!

重新了解您的电池

我的背景是HP ProLiant服务器,这些服务器的Smart Array控制器没有经过此练习(或者至少具有更主动的电池寿命监控)。这似乎是一个可怕的功能(最大的不便,很少的收益),但是我处于许多LSI控制器(在Supermicro硬件上)的环境中,并且希望了解是否可以将一揽子策略应用于相关系统。

  • LSI控制器上的重新学习周期的默认时间表是什么?
  • 这些重新学习周期有用吗?
  • 是否应禁用此功能?
  • 如果您选择在环境中启用此功能,那么如何处理计划?您是手动安排此时间,还是允许控制器设置自己的时间表?
  • Dell Perc控制器是否以相同的方式受到影响?(LSI是OEM

我无法回答其余的问题,但是PERC确实可以重新学习。
MDMarra

较新的LSI控制器应该具有“透明重新学习”选项。在实践中(在Dell C类硬件上),我还没有看到这项工作。
toppledwagon

Answers:


13

就在最近,我读了Godaddy的一位工程师关于这一主题的文章:学习应对学习

在其硬件(Dell PERC卡)上,电池学习周期每90天发生一次,但无法知道确切的时间何时发生,即在高峰或非高峰时间。

他们讨论了不同的解决方案:

  • 完全禁用电池学习。此选项的问题是您不知道电池的状态以及电池可以存放多长时间和多少电量,因此在断电的情况下,您可能会面临数据丢失的风险。

  • 使用其他硬件。一些控制器有2个电池,在这样的学习周期中它们之间会翻转。此外,有些RAID控制器(例如Dell H710)不需要电池,而是使用非易失性NVRAM来存储未提交的数据。

  • 无论电池状态如何,都强制强制回写(缓存)。与第一种解决方案一样,您也面临着数据丢失的风险。

最终,他们在非高峰时段设置了克朗,以监视下一个学习周期,如果它在接下来的24小时之内,则迫使它立即发生。这样,他们可以保持锻炼电池的好处,而无需在高峰使用时间运行电池。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.