在某些情况下,可以将“企业”驱动器安全地替换为近/中线吗?


22

在指定服务器时(例如,我假设许多不是存储专家的工程师),我通常会通过标准化最少1万个SAS驱动器(因此是“企业级,具有24x7占空比等)来存储“系统”数据(通常是OS,有时是应用程序),并保留使用7.2k中/近线驱动器来存储性能不太重要的非系统数据因子。所有这些都假设使用2.5英寸(SFF)磁盘,因为3.5英寸(LFF)磁盘仅与大容量,低IOP要求真正相关。

在没有大量非系统数据的情况下,我通常将其放置在与系统数据相同的磁盘/阵列上,这意味着服务器仅具有1万个SAS驱动器(通常为“一个大RAID10”类型)这些天的设置)。仅当非系统数据的大小很大时,我通常才考虑将其放在单独的7.2k中/近线磁盘阵列上,以降低成本/ GB。

这使我想知道:在某些情况下,是否可以将RAID10阵列中的那10k磁盘替换为7.2k磁盘,而不会造成严重的负面影响?换句话说,我有时会坚持至少1万个“企业”级磁盘来进行过度规范(并让硬件供应商满意),还是有充分理由始终坚持这种最低标准?

例如,对于典型的小公司(例如50个用户),使用一台充当具有虚拟机管理程序的服务器,并带有几个VM。该公司具有平均I / O模式,无特殊要求。典型的星期一至星期五9-5点办公室,备份每晚运行几个小时。这些VM可能是DC和文件/打印/应用服务器。该服务器具有一个RAID6阵列,该阵列带有6个磁盘,用于存储所有数据(系统数据和非系统数据)。在我的非专家眼中,看起来中/近线磁盘可能还不错。以HP磁盘为例:

  • 工作负载:中线磁盘的额定工作负载小于40%。由于办公室每天仅开放9个小时,并且此期间的平均I / O不可能接近最大,因此工作量似乎不可能超过40%。即使晚上有几个小时的密集I / O进行备份,我猜它仍会低于40%
  • 速度:尽管磁盘只有7.2k,但通过将其分布在六个磁盘上可以提高性能

因此,我的问题是:合理地放置至少1万个SAS驱动器,还是在许多情况下7.2万个中线/近线磁盘实际上足够用?如果是这样,我该如何衡量线路的位置并通过安全玩耍来避免成为无知的奴隶?

我的经验主要是使用HP服务器,因此上述内容可能会对HP有所偏见,但是我认为这些原则在很大程度上与供应商无关。


3
由于容量和负载限制,SFF 7.2k中线磁盘毫无意义。如果您在谈论HP设备(我的专长),那么如果不使用SSD,则900GB和1.2TB的10k SAS驱动器将是最佳选择。如果您在美国,如果您有好的供应商,则900GB SAS的价格应为$ 300-400。
ewwhite

1
轻微的语法投诉:如果您说“用X代替Y”,则表示您以Y开头,并将其替换为
X。– pjc50

2
确定您住在2015年?因为多年来,我的OS驱动器是小型SSD(节省功率等),而且我也不会触摸任何HD以获得高性能。
TomTom

1
@TomTom不,我在2016年:)认真地说,我还没有真正考虑过它。就像我在帖子中所说的那样,这些天我通常会采用“一个大型RAID 10”方法,因此操作系统将继续存在。如果没有必要,将操作系统分离到单独的SSD上似乎很浪费。我很想听听您的想法。您将使用单个SSD还是一个镜像对?也许这本身将是一个不错的SF问题……
dbr

1
操作系统的镜像对。惠普甚至出售特定于操作系统/启动的SSD。
ewwhite

Answers:


25

服务器设计,磁盘技术和经济学之间有一个有趣的交集:

另请参阅:为什么大型磁盘(LFF)仍然很流行?

  • 转向密集型机架安装和小型服务器。例如,您不再看到主要制造商提供的许多塔式产品,而密度较大的产品线则需要更频繁地进行修订,并且具有更多的选择/可用性。
  • 3.5“企业(15k)磁盘开发中的停滞-600GB 15k 3.5”大约可以容纳。
  • 2.5英寸近线(7.2k)磁盘容量增长缓慢-2TB是您所能找到的最大容量。
  • 高容量SSD的更高可用性和更低价格。
  • 将存储整合到共享存储中。有时可以通过SAN为需要高容量的单服务器工作负载提供服务。
  • 全闪存和混合存储阵列的成熟,以及存储初创公司的涌入。

以上就是为什么您通常会发现制造商专注于具有8-24个2.5英寸磁盘驱动器托架的1U / 2U服务器的原因。

3.5英寸磁盘适用于低IOP大容量使用案例(2TB +)。它们是外部存储机柜或带有某种形式的缓存的SAN存储的最佳选择。在企业15k RPM速度下,它们最多只能使用600GB。

2.5英寸10k RPM旋转磁盘可满足更高的IOPS需求,通常可提供高达1.8TB的容量。

2.5“ 7.2k RPM旋转磁盘是一个不好的称呼,因为它们既没有容量,性能,寿命或价格优势。例如,900GB SAS 10k驱动器的成本非常接近1TB 7.2k RPM SAS的成本。区别在于,最好购买900GB驱动器,例如1.8TB的10k SAS2.0TB的7.2k SAS,价格也非常接近,保修期分别为3年和1年。

因此,对于服务器和2.5英寸内部存储,请使用SSD或10k。如果您需要容量需求,并且内部或外部都有3.5英寸驱动器托架,请使用7.2k RPM。

对于您描述的用例,您并没有过度配置服务器。如果它们具有2.5英寸驱动器托架,则您实际上应该只使用10k SAS或SSD。中线磁盘会损失性能,容量,保修时间明显缩短,并且不会节省太多成本。


感谢您抽出宝贵的时间来整理这些内容。明天我将有机会对此进行适当的思考。只需快速查看价格,它看起来就从1TB 7.2k到900GB 10k大约有30%的增长,这并不是很大(如果重要的话,我在英国)。如果您预算紧张,则可能是一个因素,尽管您试图在多个地方进行合理的节省,而磁盘选择只是其中之一。我也很想听听您从纯技术角度对这个问题的看法。
dbr

从技术角度来看,7200 RPM 2.5英寸磁盘没有任何优势。如果成本似乎太高了,那就继续购物。这个市场几乎没有什么区别。如果这是用于引导磁盘,那么SSD是一个不错的选择。但是我我想不出今天在服务器中使用HP 7200 2.5英寸磁盘的任何原因。另外,请仔细阅读您的HP快速规格。中线驱动器的保修期较短。
ewwhite

1
总的来说,这个答案很好。但是,与其他任何事物一样,“取决于情况”。在900GB 10k vs 1TB 7200磁盘的示例中,1TB磁盘运行温度较低,因此使用寿命可能更长,并且价格会更低。如果您不需要额外的性能,那么这会浪费金钱,包括原始资本成本和运营成本。对于一台服务器,这无关紧要。对于10,它开始累加。
丹·普里兹

2
确实,运行较慢的磁盘会持续更长的时间吗?我缺少任何文章吗?
vasin1987 '16

2
从供应商/制造商的角度来看,是的。他们会引导您选择2.5英寸的10k和SSD。如果您是白盒装,则选择7200 RPM。实际上,我的ZFS存储供应商PogoStorage对其ZFS阵列使用7200 RPM 2.5“,因为缓存和SSD分层消除了需要指定更快的磁盘。
ewwhite

5

至少有几件事可能会导致某些驱动器类型出现问题:

  • 并非旨在应对具有多个驱动器的机箱的振动负载的驱动器(指定为具有RAID / NAS功能的任何驱动器均不太可能出现问题)

  • 不允许TLER或需要费时的手动重新配置驱动器才能启用它的固件(ditto)

  • 从未使用过的RAID控制器进行过测试的驱动器,并且在这种设置中可能会出现无法识别的错误

  • 内部驱动器写入缓存的行为(物理写入不正常或非常延迟)会在硬关机(RAID控制器应配置为强制关闭)的情况下引起很多混乱。如果固件应忽略,则可能出现问题那。参见未测试的驱动器:)

  • 驱动器偶尔可能会执行内部维护例程,这可能会使驱动器运行缓慢或响应足够长,从而使RAID控制器认为它发生了故障(与TLER相关)

  • 相对于SAS而言,一般而言,与具有完全击发或悬空的电子装置将所有部件悬挂在控制器上的驱动器相比,SATA的保护措施较少(从理论上讲不是危险,某些磁盘+控制器品牌组合喜欢这种故障模式)。


1
这些似乎是使用符合服务器硬件和应用程序堆栈要求的驱动器的原因,但并不是专门针对10k vs 7k2 rpm的驱动器。
poolie

1
对于“应用程序中是否可以使用非企业版7.2k磁盘或指定用于单驱动器企业级磁盘的问题?”,这个问题很容易被误解。“安全”通常意味着解决数据丢失或与故障相关的停机时间的风险。
rackandboneman

4

巨大的问题:

(可能有点偏离主题了,但我不是很重要!

当您使用SSD时(通常是这种情况,或者可能是诱惑或情况),许多 SSD都有一个令人讨厌的问题,即它们无法始终从自然停电中恢复!

这是HDD的一个问题。HDD通常具有足够的电容来为其逻辑供电,并且具有足够的角动量来完成写入512字节块的操作,从而在完成写入过程中断电的情况下完成对磁盘的传输。一旦在一个罕见的,同时,这将工作,导致一种叫做“断写” -在一个单一的块可以部分写入。部分写入(罕见)将导致块上的校验和失败-即单个块将是坏的。通常可以通过磁盘电路本身将其检测为不良,并由上游RAID控制器进行纠正。

SSD是另一种动物。通常实现一种称为“损耗平衡”的方法-它们不像HDD那样将“ X块”直接写入“ X块”的物理位置。相反,他们尝试写入闪存介质上的不同位置-并且尝试汇总或合并写入(使用一些缓冲)。写到不同的地方需要保留写东西位置的“地图”,并以减少磨损平衡的方式进行缓冲和写出。损耗均衡的一部分甚至可能涉及移动设备上已经存在但尚未写入的数据。

问题是,当SSD断电时-内存中有很多数据(未刷新),某些数据已写到不同/更改的位置-并且这些映射在其自己的内存中需要冲掉以对设备上所有数据的结构有任何了解。

许多 SSD没有逻辑或电路,无法在自发断电时保持其控制器正常工作并存活足够长的时间,从而无法安全地将所有这些数据刷新以在其死亡之前进行刷新。这不仅意味着您编写的一个块现在可能处于危险状态-而是其他块-甚至设备上的所有块都可能出现问题。许多设备还存在问题,它们不仅会丢失设备上的所有数据,还会使设备本身变砖,无法使用。

这是完全正确的理论-但是(在存储行业中工作)-我/我们已经看到这种情况在太多设备上发生了太多次了,包括在我们自己的一些个人笔记本电脑中!

许多厂商讨论了制造“企业级固态硬盘”的问题,其中专门添加了设备(“超级电容”)和其他电路以进行干净的“冲洗”-但是,很难找到任何明确声明是其一部分的设备。数据表,它具有足够的,明确的,经过测试的保护,免受此类事件的侵害,并将防止此类事件的发生。

显然,如果您从采用闪存技术的顶级供应商那里购买了“高端存储阵列”,则其驱动器或整个系统的设计都考虑到了这一切。确保有!

关于您的问题的问题是:如果您有RAID阵列-且其中一些磁盘是没有此保护的“坏” SSD-如果您遇到“自发断电”-您可能会丢失多张磁盘上的所有数据使得无法进行RAID重建。

“但是我使用UPS”

通常还需要注意的是,“自发断电”可能包括诸如BSOD和内核锁定/崩溃/紧急情况之类的情况-在这种情况下,您无法选择拔出系统上的插头来进行恢复。


2
很少有人会迅速拔下挂起的系统上的插头(除非它正在浪费磁盘),以至于不允许任何类型的磁盘刷新其缓存。在那种情况下,具有启用缓存的常规HDD可能产生相同的混乱,尽管发生阻塞的可能性较小,但仍然有很大的数据损坏的可能性-Reiserfs,早期的NTFS,由于处理日志数据,它们往往最终会因此而出手。被写为实际上没有发生的活动(反之亦然,可能都是由于乱序缓存刷新),非常糟糕。
rackandboneman's

2
如果未完全刷新数据,则设计正确的SSD不会损坏或丢失数据。由于每个逻辑扇区的物理位置可以在每次写入时更改,因此如果尚未刷新更新,则每个逻辑扇区中的数据的先前版本仍应存在。如果固件存在设计缺陷或实施错误,您仍然可能丢失数据。
kasperd '16

1
@kasperd消费型固态硬盘是以速度为基础出售的,它们为此做出了让步。尽管可以按照您的建议维护完整性,但事实是大多数制造商(至少在消费者级别)并不这样做。同样,当他们达到EoL时,请不要轻易失败。
JamesRyan

@JamesRyan关于制造商为了将某些性能指标表现得更好而欺骗将数据刷新到持久性存储的故事并不是新鲜事。我们也听说过,硬盘时代也是如此。这不是因为这是消费者想要的。这是因为消费者只看到一些指标,却不知道制造商如何在其他方面作弊以达到目标。有时制造商会逃避作弊,有时则不会。(我敢肯定有人会想出一个受最近新闻启发的汽车类比。)
卡巴斯德(Kasperd

2
SSD是另一种动物。他们有映射表告诉数据在哪里。他们正在移动和重定位数据并调整这些地图。他们需要合并他们的写操作(即推迟,将它们聚在一起并稍后写),以避免写放大。地图本身不能被激进地编写,需要遵循这些相同的规则。我们可以讨论“适当的设计”和缺陷-但SSD并非像杂乱无章的文件系统(这并不简单)那样“简单”。我说的是很多经验,测试,规格,我可能会也可能不会和制造商谈过,或者说是两个或三个。
布拉德
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.