SSD驱动器是否像机械驱动器一样可靠(2013年)?


162

SSD驱动器已经存在了几年。但是可靠性问题仍然存在。

我想这是4年前发布的这个问题的后续活动,最近一次更新是在2011年。现在是2013年,发生了很大变化吗?我想我在寻找一些真实的证据,而不仅仅是直觉。也许您在DC中使用它们。您的经历如何?

固态硬盘的可靠性


更新:

现在是2016年。我认为答案可能是肯定的(可惜的是,它们每GB的成本仍然更高)。

该报告提供了一些证据:

生产中的闪存可靠性:预期和意外

还有一些有关(消费者)机械驱动器的有趣数据:

Backblaze:硬盘数据和统计


2
为什么说可靠性问题仍然存在?
ewwhite

6
我妻子的笔记本电脑SSD每隔几个月就会停止工作,并且需要进行奇怪的“开机但不要尝试启动二十分钟”修复程序。那又好了 新技术,新的失败方式。
Jaydee

3
恐怕仅是一个数据点:去年9月,我购买了MacBook Retina Pro,并且60天内出现终端SSD故障。更换单元已经很好,但是我现在对此非常警惕,因为用户更换/升级这些单元确实不是一种选择。
罗迪

27
无论如何,您都不需要可靠的驱动器。如果它每天下午2点失败,您将可以依靠它来设置手表。您想要的是弹性驱动器。
艾伦B

3
固态硬盘已经出现了很多长于“异数”。实际上,甚至超过40个,即使您指的是基于闪存的SSD,我们也谈20年了。
alastair

Answers:


175

这将取决于您的工作量和所购买驱动器的类别。

在我的服务器部署中,我没有遇到规格正确的SSD故障。这涉及许多不同类型的驱动器,应用程序和工作负载。

请记住,并非所有的SSD都是一样的!!

那么“正确指定”是什么意思?

如果您的问题是关于企业和服务器应用中使用SSD的问题,那么自最初提出的问题以来,过去几年已经发生了很大变化。这里有几件事情要考虑:

  • 确定您的用例:有消费者驱动器,企业驱动器,甚至是坚固的工业应用SSD。不要购买用于台式机的廉价磁盘并在其上运行写密集型数据库。

  • 有许多可用的外形尺寸: PCIe卡,SATA和SAS 1.8“,2.5”,3.5“和其他变体中可以找到当今的SSD。

  • 对服务器使用RAID:在服务器情况下,您将不再依赖单个机械驱动器。为什么要对SSD执行相同的操作?

  • 驱动器组成:有基于DRAM的SSD,以及MLC,eMLC和SLC闪存类型。后者的寿命有限,但制造商已对其进行了明确定义。例如,您将看到每天写入限制,例如3年内每天5TB

  • 驱动器应用很重要:某些驱动器是通用的,而另一些驱动器是经过读优化或写优化的。像sTec ZeusRAMDDRDrive这样的基于DRAM的驱动器不会磨损。这些是高写入环境和较慢磁盘的理想选择。MLC驱动器往往更大,并且针对读取进行了优化。SLC驱动器的寿命比MLC驱动器的寿命长,但是企业MLC确实对于大多数情况而言已经足够了。

  • TRIM似乎无关紧要:硬件RAID控制器似乎仍未完全支持它。在大多数情况下,我使用SSD时,它将使用硬件RAID设置。这不是我在装置中担心的事情。也许我应该?

  • 耐用性:在服务器级SSD中,过度配置很常见。有时,这可以在固件级别完成,也可以仅通过正确方式对驱动器进行分区来完成。总体上,损耗均衡算法也更好。某些驱动器甚至报告寿命和耐用性统计信息。例如,我的某些HP品牌的Sandisk企业级SSD 98% life remaining在使用两年后才显示出来。

  • 价格已经大幅下降: SSD在许多应用中都达到了正确的性价比。当确实需要性能时,现在很少会默认使用机械驱动器。

  • 名声已经得到巩固: 例如,英特尔是安全的,但不是高性能。OCZ不可靠。基于Sandforce的驱动器很好。sTec / STEC非常坚固,是许多高端阵列驱动器的OEM。Sandisk / Pliant与此类似。OWC具有出色的SSD解决方案,并为低冲击服务器以及工作站/笔记本电脑部署提供了卓越的保修。

  • 功率损耗保护很重要:查看具有超级电容器/超级电容器的驱动器,以处理功率事件期间的未完成写操作。一些驱动器通过板载高速缓存来提高性能,或者利用它们来减少磨损。超级大写确保将这些写操作刷新到稳定的存储中。

  • 混合解决方案:硬件RAID控制器供应商提供了使用SSD扩展标准磁盘阵列的功能,以加快读写速度或充当智能缓存。LSI具有CacheCade及其Nytro硬件/软件产品。还存在软件和操作系统级别的解决方案,以执行诸如在应用程序,数据库或系统管理程序系统上提供本地缓存的操作。像ZFS这样的高级文件系统可以非常智能地使用经过读写优化的SSD。可以将ZFS配置为将单独的设备用于辅助缓存和意图日志,并且即使在HDD池中,也经常以这种容量使用SSD。

  • 顶级闪存已经到来:FusionIO之类的PCIe闪存解决方案已经成熟,组织可以轻松地部署依赖于增强性能的关键应用程序。像RanSanViolin Memory这样的设备和SAN解决方案也仍然存在,并且有更多的参与者进入这一领域。

在此处输入图片说明


12
TRIM在很少有过度配置的驱动器中非常重要,这在$ / GB非常重要的消费类驱动器中非常常见。大多数企业驱动器都有足够的超额配置,因此TRIM不会产生任何影响。
阿尔法先生

2
@MisterSmith看看我上面写的。不同的SSD具有不同的特性。使用正确的工具完成工作。如果我要使用Corsair或其他消费者级别的驱动器,并将其用作活动写入密集型数据库系统的SSD或用作ZFS存储阵列的ZIL日志设备,则我将在一两个月内将其耗尽
ewwhite

1
优秀的职位。我的一个烦恼:RAID控制器并非总是SSD的正确选择。RAID控制器旨在条带化数据并在多个磁盘之间添加纠错码。SSD控制器已经在本地对数据进行条带化,并在多个NVRAM库之间添加了纠错码。另外,添加RAID控制器会引入一个额外的SPOF,即RAID控制器本身。通常,使用单独的RAID控制器是正确的选择,但有时使用更好的SSD(更高级别的SATA / SAS甚至是Fusion-IO之类的PCI-E卡)是更好的选择。
Jesper Mortensen

5
@rickyduck,实际上,在数据中心中,单个驱动器故障受RAID保护,这意味着要花一些钱来更换它,而不会造成停机。而在游戏平台中,单个驱动器的故障是数据丢失和重新安装操作系统。

2
@MisterSmith甚至高端台式机固态硬盘每GB的价格也比针对典型数据中心用途的固态硬盘便宜。除了某些情况下功能更强大的控制器(或仅针对吞吐量而不是突发性能而调整的小容量固件)之外,它们还可以在生产运行的顶部获得最佳闪存,因为许多服务器工作负载的IO密集度比台式机高驱动器,并会很快杀死消费者驱动器。
丹·尼利

59

自2009年以来,我工作的每台笔记本电脑都具有SSD或Hybrid硬盘。我的SSD经验总结如下:

  • 我称之为“第一代”驱动器,主要在2009年左右售出:
    • 在第一年中,大约有1/4人死亡,几乎都是死于猝死综合症(SSD-有趣,大笑)。这对于最终用户来说是非常明显的,并且很烦人,但是巨大的速度差异使得这种持续的故障模式是可以容忍的。
    • 3年后,所有驱动器均已死亡(突然死亡或磨损),只有两个仍在踢(实际上是服务器中的L2Arc驱动器)。
  • “第二代”驱动器在2010-11年度销售,与上一代产品截然不同,因为它们的“猝死综合症”比率急剧下降。但是,磨损的“问题”仍在继续。
    • 在第一年之后,大多数驱动器仍然可以工作。有几起猝死事件。一对夫妇因磨损而失败。
    • 2-3年后,一半以上仍在工作。第一年的失败率基本上一直保持着。
  • 2012年销售的“第三代”驱动器仍在工作。
    • 第一年之后,所有工作仍然有效(敲木头)。
    • 我拥有的最旧驱动器是2012年3月,所以还没有2-3年的数据。

SSD故障(累积)


2014年5月更新:
此后一些“第二代”驱动器发生了故障,但是大约三分之一的原始驱动器仍在工作。上图中的所有“第三代”驱动器仍在工作(敲击木头)。我从其他人那里听到过类似的故事,但他们仍然怀有同样的警告,说快死了。警惕的人会很好地备份他们的数据。


2
我的经验与此相呼应。也就是说,我们仍然为员工提供USB硬盘驱动器,以用作时间机器备份(除了我们的标准异地备份方案),以便在灾难性故障或丢失时进行快速,细致的还原。
EEAA 2013年

22
再给第三代一两年。;)
Andy

7
同样值得注意的是,与HDD相比,SSD遭受固件错误的可能性要大得多。固件既复杂又不成熟,这不是一个很好的组合。
alastair

2
@安迪是正确的。从2009年开始,您说半衰期约为一年。对于2010年至2011年,我们目前只有3岁,处于该范围的中间,在此您可以指出3年半衰期。那只能基于当前的观察。至少要到2016年,我们才真正知道2012年和2013年驱动器的半衰期是否已提高到3年以上。定期使用。)
Andrew Vit

1
自2010年以来,我一直在使用2 x Intel X25M 80Gb G1。我的工作涉及繁重的读/写过程。每隔几个月左右,我都会重置驱动器(不必这样做)以恢复性能,但是零故障。我去年添加了一个256Gb的Samsung 230。到目前为止没有问题!
Antillar Maximus

18

以我的经验,真正的问题是控制器快要死了,而不是闪存本身。我已经安装了大约10个三星SSD(830、840 [不是专业人士]),到目前为止,它们都没有出现任何问题。完全相反的是使用Sandforce控制器的驱动器,我在使用OCZ敏捷性驱动器时遇到了几个问题,尤其是在不规则的时间间隔内冻结,在此期间驱动器会停止工作,直到我关闭计算机电源为止。我可以给你两个建议:

  1. 如果需要高可靠性,请选择带有MLC和更好的SLC闪存的驱动器。三星840 fe具有TLC闪光灯,并且保修期短,我认为并非没有任何原因;)

  2. 选择带有已知稳定的控制器的驱动器。


让我想起了当前基于LED的照明系统中即将死去的控制器。LED的使用寿命很长,但控制器似乎没有。
马特

1
谁知道,但这可能是计划中的行业过时的一部分:)
klingt.net

11

www.hardware.fr是法国最大的硬件新闻网站之一,也是法国最大的在线经销商之一www.ldlc.com的合作伙伴。自2009年以来,他们可以访问其返回统计信息,并每年两次发布故障率报告(母板,电源,RAM,图形卡,HDD,SSD等)。

这些是使用6个月至1年的“早期死亡”统计数据。此外,也无法计算直接返还给制造商的退货,但是大多数人在第一年就返还转销商,这不会影响品牌和型号之间的比较。

一般来说,HDD故障率在品牌和型号之间的差异较小。规则是更大的容量>更多的盘片>更高的故障率,但是没有太大的变化。

SSD总体上的故障率较低,但某些SSD型号确实很差,在您要求的期间(2013年),臭名昭著的型号的回报率约为50%。现在,这个臭名昭著的品牌被收购似乎已经停止了。

一些SSD品牌正在“优化”其固件,只是为了在基准测试中获得更高的结果,有时您会遇到死机,蓝屏等问题。与2013年相比,现在看来这不再是问题。

故障率报告在此处:
2010
2011(1)
2011(2)
2012(1)
2012(2)
2013(1)
2013(2)
2014(1)
2014(2)
2015(1)
2015(2)
2016(1 )
2016(2)



By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.