24磁盘阵列的最佳做法


9

我们刚刚将旧的光纤SAN存储迁移到了具有24个SAS 600GB磁盘的IBM v3700 storwize。

此存储直接连接到两个IBM ESXi 5.5服务器,每个服务器具有两个6Gbps多路径SAS控制器。

到目前为止,我已经将已使用的存储配置为多个RAID5组。每个组将用于不同的服务器/用途。RAID组主要是OracleDB,Oracle存档,SQL Server和其余(文件服务器,邮件等)。最关键的应用程序是Oracle和SQL Server。

我首先关心的是安全性,然后是我们应用程序的性能。因此,我决定使用RAID6 +备用磁盘。

现在,我主要担心的是,由于我们使用的是ESXi,我应该将整个存储配置为一个RAID,以节省空间,并为每台服务器从ESXi创建数据存储卷,或者这不是一个好习惯,最好创建单独的RAID。硬件RAID组?


4
投票赞成关闭此程序的人:这不是基于意见的问题,而是最佳实践问题。供应商提供了一个答案,它是serverfault上的主题。
罗勒

Answers:


7

每个供应商都有自己的建议,因此请先咨询IBM。通常,您无需支付额外的支持即可打开故障单以寻求配置建议。那个或那个卖给你的人都可以。

简短地谷歌搜索,我发现了这本红皮书。页面212,您可能需要基本RAID 6,这意味着1个备用磁盘和每个阵列目标12个驱动器。这将意味着两个RAID,12个之一,一个11个。我不建议RAID 10,因为您损失了一半容量。它确实避免了奇偶校验,但这只是您在低端或内部存储上需要担心的事情。您的存储将在缓存后隐藏随机覆盖的奇偶校验开销。我的商店专门针对RAID的半GB的VMWare 5.5使用RAID 6,这很好。

您应该阅读该书,并了解它们如何执行mdisk和池。一旦设置了RAID组,您想创建一个池来在所有纺锤上分布宽条纹。


4

免责声明 -这是高度基于意见的,并已将问题标记为这样,但是由于我最近配置的配置几乎完全相同,因此我将尝试提供答案。

我非常怀疑任何一种数据库在RAID5或6阵列上的性能都很好。由于重建时间长,大多数供应商都积极劝阻(甚至在某些情况下禁止)使用基于嵌套的奇偶校验RAID级别,这会导致重建期间的风险增加或URE。

我个人将其分为两个不同的组:用于高IO负载(如数据库)的RAID10和用于其余数据的RAID50。您为每个阵列分配多少磁盘取决于您需要存储多少数据。

例如,对于您的24磁盘阵列,您可能会丢失两个磁盘作为磁盘阵列备用磁盘,并创建四个2磁盘跨度(因此总共8个磁盘)来获得大约2.4TB的逻辑RAID10。这样就为RAID50保留了14个磁盘,每个跨度有7个磁盘,以及大约7.2TB的可用空间。当然,您可以调整跨度的数量,但要记住RAID10需要2的倍数。

对于数据存储,如果您不使用诸如Storage vMotion和DRS之类的功能来随机分配资源,那么它实际上并不会产生太大的变化。

另外,为了澄清您的最后一段:由于重建故障磁盘需要花费时间,并且重建过程中会给其他磁盘带来负担,因此,更多,较小的磁盘通常比较小,较大的磁盘可取。


我必须同意您的意见,并接受您对数据库RAID10的建议。我不确定v3700是否支持RAID50,因为它可以升级到RAID10。这是通过存储管理器的两阶段设置完成的吗?
teo

6
您的标志不正确-这是一个带有特定且正确答案的特定问题。IBM的一本红皮书包含了所要求的信息。另外,您对RAID 5和RAID 6的评论对企业存储而言是不正确的。在12个驱动器600GB的RAID上进行的重建时间不是在7200个4TB驱动器上进行的为期数周的重建。此外,RAID 50不会在此存储存在,它们使用含有从RAID 5,6的多个RAID组,或10区段宽条纹池
罗勒

1

对于数据库风格的工作负载,我永远不会选择RAID6,甚至5。由于它们基于奇偶校验,因此会产生较高的写代价,并且重建时间可能非常庞大。

RAID 10将为您提供最佳性能,您可以在阵列的每一侧发生一次故障,还可以分配一两个热备用磁盘,以确保在驱动器发生故障时,阵列可以快速恢复其冗余。

关于存储分区和表示方式...我通常遵循每个RAID组1个LUN的方案,每个LUN然后包含几个VM磁盘。


3
600GB SAS磁盘上的重建时间并不多。您的建议适用于7200 RPM的本地存储,而不适用于具有大型控制器写缓存和小型快速主轴的企业存储。另外,对于VMWare 5.5,建议每个数据存储区使用两个LUN,并且应尽可能使用宽条带化,以使每个LUN能够访问所有心轴的基础性能,而不仅仅是单个阵列。
罗勒

1
无论哪种方式,基于奇偶校验的RAID与条带和镜像(性能和重建)相比都比较慢,并且仅在涉及容量的情况下才需要使用,而不是在IOPS和吞吐量方面使用。
tomstephens89

4
RAID 5重建的问题是完成所需的时间更少,而是需要读取的数据量(即,尚存磁盘的所有数据)而没有单个不可恢复的读取错误:
Hagen von Eitzen

1
我不建议突袭5,哈根。我建议您进行RAID6。汤姆,问题是,他们有24个600GB SAS磁盘。没有大量的大型慢速磁盘,也没有任何SSD(无论该技术的建立方式如何)。这个问题非常明确。
罗勒

2
企业驱动器上不可恢复的错误率通常比台式机模型好一百倍。对重建的关注并不是特别重要。
Sobrique 2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.