我需要RAID Fusion-io卡吗?


27

是否可以在服务器中安装单个Fusion-io卡的情况下可靠运行,还是需要在软件RAID设置中部署两个卡?

在审查他们的营销材料时,Fusion-io在这个主题上不是很清楚(几乎是误导),考虑到这些卡的成本,我很好奇其他工程师如何在现实场景中部署它们。

我计划将HP品牌的 Fusion-io ioDrive2 1.2TB卡用于在Linux上运行的专有独立数据库解决方案。这是单服务器设置,没有真正的高可用性选项。还有,用10分钟的异步复制RPO该反射镜事务日志到第二物理服务器。

传统上,我将为高端HP ProLiant服务器指定该应用程序的最高CPU步进。我需要使用SSD,并且能够以低于企业SAS SSD的价格购买Fusion-io,以获得所需的容量。

  • 我是否需要运行两张ioDrive2卡并将它们与软件RAID(md或ZFS)结合在一起,还是不必要?
  • 除了担心RAID控制器故障或主板故障外,我还应该更多地关注Fusion-io故障吗?
  • RAID等系统管理员。给定此外形尺寸中可用的接口和卡片上的磨损均衡/纠错功能,这是否需要不同的思维方式?
  • 什么IS这些设备的故障率是多少?

编辑:我刚刚读了Dell 的Fusion-io可靠性白皮书,其收获似乎是“ Fusion-io卡具有很多内部冗余……不必担心RAID!”


如果您提高IOPS限制,软件团队和/或PCIe总线是否还能跟上?老实说,我不知道,但是值得一试。
pauska

1
PCIe总线将保持同步。软件RAID(如果需要)将基于ZFS,因此具有功能。我现在已经订购了两张卡,但是Fusion-io文献似乎说:“一张卡就足够了”。
ewwhite

甚至ZFS都需要使用CPU周期来镜像数据,因此确实增加了复杂性和延迟-但是无法确定将对特定应用程序产生多大影响。融合似乎是非常骄傲的内部镜像它们的低CPU成本/维护..
pauska

Answers:


16

最终,它取决于您的故障模型。失败有什么影响?

从历史上看,我们一直RAID一切,因为这样做的成本可以忽略不计。镜像驱动器还需要500美元吗?完全值得的成本,甚至无需考虑它。

当您谈论另外1万美元以上的费用来启用镜像时,还需要更多考虑。


不,您不需要镜像

Fusion-io的卡也有相当不错的内部冗余。这不是您的磁盘是单芯片的硬件。在我观察到故障的大多数情况下,这是固件问题,已影响到镜像的两个成员,因此RAID不会有问题。

可以将Fusion-io卡看作是RAID控制器,其背后有磁盘。您使用单控制器设置是否还好?大概。那样对待。

在许多将要部署Fusion-io驱动器的设置中,您将内置其他保护措施(在节点级别实现冗余),因此没有太大意义。


是的,你需要镜子

RAID可提高可用性。尽管有成本,您是否需要绝对最大的可用性?故障的成本和可能的停机时间是否昂贵?继续并镜像驱动器。在具有统计意义的大型设置中,尽管有内部保护措施,您仍将出现驱动器故障。


更新:我已经将Fusion-io卡镜像到客户可以接受的额外支出的安装中(并简化了自己部署产品的过程)。在其他情况下,我已经部署了许多单卡安装。到目前为止一切都很好...
ewwhite

18

设备上的冗余应该可以很好地完成闪存芯片故障的工作-类似于进行实际数据存储的所有组件中的RAID。

除了担心RAID控制器故障或主板故障外,我还应该更多地关注Fusion-io故障吗?

整个设备的故障几乎类似于RAID控制器或主板的丢失-与其他单点故障组件一样,我对Fusion-io卡的担心大约与之相同,尽管我并不担心。在大规模使用设备方面经验丰富,能够使用硬数据比较故障率。

我是否需要运行两张ioDrive2卡并将它们与软件RAID(md或ZFS)结合在一起,还是不必要?

除了设备已经具备的功能之外(例如,多个Fusion-io卡之间的软件RAID)增加冗余,就像在两个不同RAID控制器上的两个硬件RAID组之间进行软件RAID一样;对于需要极端冗余以消除额外的单点故障的系统而言,这可能是值得的,但对于常见的部署而言,则不值得(镜像上的10分钟RPO对于大多数应用程序来说应该足够了吗?)。

像RAID这样的系统管理员。给定此外形尺寸中可用的接口和卡片上的磨损均衡/纠错功能,这是否需要不同的思维方式?

是的,我是这样认为的。本质上,您将获得一个像RAID控制器这样的设备,并在一个软件包中得到一堆存储设备。这肯定很有诱惑力的担心把一个单一的设备上的敏感数据,但是需要在设备的内部冗余一定的信任水平......这应该与“RAID的健康认识反平衡是不是“备份 ”的概念:总是为冗余组件的故障做好准备,或者让用户删除具有良好备份的数据。


13

如您所知,在RAID和非RAID设置中我们已经使用了他们的套件有一段时间了-我希望我能给您一些失败的经验,但我没有。我们没有RAID可以解决的任何故障,而且其板上的弹性功能也越来越好。而且,我们现在将它们用于的主要功能现在已在水平方向缩放/成簇,因此我们没有更多理由来RAID它们。很棒的卡片,强烈推荐他们。


一个好的数据点。但是,我只是无法确定添加RAID层是否过大。
ewwhite

1
我认为技术不是此处的定义点-您的数据需要支持丢失单个FusionIO卡的能力,还是它不需要-只是将它们视为快速,昂贵的磁盘-无论您是否要更改它,都不会改变可以没有RAID就生存吗?
Chopper3

略...传统方法是在RAID 1 + 0中使用企业SAS SSD。这只是将用于将磁盘旋转到SSD的相同标准。但这还假设了热交换性。这不适用于基于PCIe的卡,尤其是当我被迫使用软件RAID来完成此操作时。由于Fusion-io还具有更好的磨损平衡和监控的优势,因此我试图了解此处涉及的实际故障模式。我是否将Fusion-io视为磁盘或控制器?您不会在ProLiant中放置两个Smart Array卡来提供内部磁盘,对吗?
ewwhite

2
@ewwhite如果您需要能够处理RAID控制器的故障,则可能有两个RAID控制器具有不同的磁盘,并且两个RAID控制器之间存在磁盘。就冗余规划而言,我想说Fusion-io卡就像RAID控制器一样。
Shane Madden

@ewwhite如果您查看我使用的措辞,您可能会在两行之间看到,我们确实在一台配备FusionIO的服务器上发生了一次停机-我们有一个主板突然出现了-DL580 G6(我们很少)碰到一整堆记忆,它掏出了谁来。在这种情况下,它是RAID 1,但显然没关系。当然要记住,PCIe 可以热插拔,它可能是一个巨大的麻烦,但可以正常工作。
Chopper3

9

我不直接熟悉Fusion,但确实有一些PCIe SSD经验可以使用。

我所使用的LUN向操作系统提供了四个不同的LUN,并将PCIe卡像HBA一样对待。如果需要RAID,则可以使用操作系统将两个LUN镜像在一起。这使我可以实现一卡通解决方案。但是,如果卡完全失败,我仍然会退缩。我不知道ioDrive是否做同样的事情。


这个特定的单元将呈现一个块设备。
ewwhite

1
ioDrive提供一两个独立的设备。如果显示两个,则它们实际上是一张卡上的两个独立设备,每个卡都有自己的内部保护。相比之下,英特尔910展示了四个设备,每个设备都应视为SSD。
MikeyB

5

在过去的几个月中,我购买了6张1.2tb卡。其中之一已经失败。所以我绝对会突袭他们。我使用Windows活动磁盘镜像。驱动器发生故障,并显示消息“缺少LEB映射”。有人告诉我需要将其替换掉。但是要获得RMA批准,我需要在发生故障的卡的两面拍照(需要停运才能将卡取出)。然后他们告诉我替换卡没有eta的存货不足。因此,在购买它们之前,您可能需要认真思考。


感谢您分享您的体验。我继续将这些1.2TB卡成对部署。我正在使用HP SKU,因此我有我的HP支持合同来处理RMA /更换。
ewwhite
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.