为什么未分区的Hitachi HDS5C3020驱动器在启动后15分钟会开始消耗更多50%的功率?


19

在Debian 6.0.6系统中,有74个2TB Toshiba DT01ABA200驱动器。这些驱动器被标识为运行固件版本MZ4OAAB0的Hitachi HDS5C3020BLE630驱动器。通过HP SAS扩展卡连接到LSI 2008 SAS控制器的64个驱动器,另外5个驱动器直接连接到主板,4个驱动器连接到基于Sil的PCI控制器,最后1个驱动器仅被供电且未连接数据电缆。控制器LSI和Sil卡的板载BIOS均已禁用,并且mpt2sas和sata_sil模块已从Linux debian 2.6.32-5-amd64#1 SMP中删除Sun Sep 23 10:07:46 UTC 2012 x86_64 GNU / Linux内核。引导后,使用/etc/rc.local中的modprobe命令加载mpt2sas模块。这74个驱动器未分区,未格式化也未安装。

系统消耗:

  • 带有0个驱动器:70.6-70.9瓦(也在启动后15分钟);
  • 带有74个驱动器:330-360瓦,刚启动后(相当于空闲状态下每个驱动器3.5-3.9W);
  • 带有74个驱动器:420-466 瓦,在正常运行时间的第15分钟内每次(相当于空闲状态下每个驱动器4.7-5.3W)。

该驱动器规格列出了4.7W作为读/写和3.3W作为空闲功耗。

5V线上的功耗增加的可能性最大,因为大约1分钟后,电源(PSU)的“过电流保护”(OCP)会关闭电源。所使用的PSU是单轨型号,在12V线上的OCP大于122A,在5V线上的OCP大于55A。

回归:

  • 将驱动器的APM值设置为禁用还是1(最大节电)无关紧要。
  • 操作系统在中没有记录任何读/写活动/proc/diskstats。那里的值与modprobe操作之后立即相同(28个读,0个写操作)。
  • 无法测试启动进入BIOS的主板时发生的情况-排除任何操作系统的干扰-因为运行固件06/27/12的Super Micro X8SI6-F主板存在一个错误,错误地将+74.0 C CPU传感器温度读取为“ “高”状态,并在1分钟后关闭电源。

引导后第15分钟,是什么导致所有驱动器上的驱动器读/写活动发生,以及如何防止它发生?


只是好奇...这是什么类型的系统?备份系统?所有软件RAID?
ewwhite

目前仅用于测试,打算用于没有任何RAID的备份存储。冗余将由可选的二级和三级服务器提供。
Pro Backup

@ewwhite让我想起了Backblaze豆荚。有人不得不提到这个名字。
Dmitri Chubarov

@Dmitri Chubarov就像一个Backblaze存储盒,但是没有SATA端口倍增器,5U高度,没有RAID,74个而不是45个驱动器,一个PSU,仅2.0瓦的冷却功耗以及当所有驱动器处于空转状态时最冷和最热的驱动器之间的温度差为6度。
Pro Backup

Answers:


20

听起来很像驱动器正在执行SMART清理(自动脱机测试)。

smartctl -a /dev/hdx

应使用以下命令确认配置:

Auto Offline Data Collection: Enabled.

禁用:

smartctl --offlineauto=off /dev/hdx

也可能是其他东西...


smartctl --offlineauto=off做到了。至少在32分钟内,功耗不再增加,不会导致PSU OCP关闭。作为奖励,hdparm -SX现在将驱动器从“活动/空闲”设置为“备用”。但是,连接到sata_sil控制器的驱动器不能为控制器。解决方法是暂时将这些驱动器插入另一个控制器。脱机数据收集设置在重新启动和关机后仍然有效。
Pro Backup
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.