带有少量SSD驱动器或许多老式HDD的SAN?


9

我的公司正在尝试确定要购买哪种类型的SAN。这特别适用于IO受限的数据库服务器(当前存储为DAS,但我们已达到单个服务器的极限,并且我们也想添加集群)。

我们需要一种能够长期产生约3,000 IOPS的解决方案(目前,我们的峰值约为1000 IOPS)。我们大多数的数据库操作都是小的读/写。根据与HP工程师和其他在线人员的讨论,带有RAID 10配置的24个SAS HD的HP P2000的价格仅为该价格的近2万美元。添加控制器和其他项以构建SAN,使我们的预算达到了3万美元左右。

但是在网上,我看到许多SAS SSD的交付速度为80,000 IOPS +。这是现实的期望吗?如果是这样,获得P2000或类似的入门级SAN并在其中插入一些SSD是否现实?我们的数据库很小,总共只有几TB。如果这样做,我们将有剩余的钱来购买第二个用于镜像/故障转移的SAN,这似乎是审慎的做法。


3
我会尽快回答。
ewwhite 2014年

您可以链接到您感兴趣使用的特定SAN型号/类型吗?HP P2000型存储阵列附带许多警告。您打算如何连接?iSCSI?纤维?SAS?
ewwhite 2014年

另外,这是什么数据库平台?
ewwhite 2014年

这是我正在查看的模型,只是具有不同的驱动器配置: aventissystems.com/product-p/200385.htm。DBMS是SQL Server Standard 2008 R2。只要我们将来可以“便宜地”扩展规模,并且只要我们保持在适度的预算范围内,我们实际上对任何配置/供应商都开放。
哔哔声

您需要多少容量?
ewwhite 2014年

Answers:


4

我可以谈谈您要完成的工作的细节。老实说,我不会考虑将入门级HP P2000 / MSA2000用于您的目的。

这些设备有很多限制,从SAN功能集的角度来看,它们不过是一盒磁盘。无分层,无智能缓存,虚拟磁盘组中最多16个磁盘,低IOPS功能,较差的SSD支持(特别是在您选择的单元上)。

您需要升级到HP MSA2040才能看到任何性能优势或SSD的官方支持。另外,您真的要使用iSCSI吗?

如果您可以容忍本地存储,DAS可能是您的最佳选择。PCIe闪存存储将在您的预算之内,但是容量需要仔细计划。

您能否详细说明实际服务器的规格?品牌/型号等

如果必须进行群集,则另一种选择是使用HP MSA2040单元,但使用SAS单元而不是iSCSI。与其他型号相比,它的成本更低,允许您连接4-8台服务器,提供低延迟和高吞吐量,并且仍然可以支持SSD。即使使用光纤或iSCSI型号,此设备也比链接的设备具有更大的灵活性。


谢谢!我们拥有所有惠普服务器,主要是惠普DL380。我们考虑使用iSCSI的唯一原因是,将其扩展到4台服务器似乎比较容易(如果我们想将其他服务器数据推送到SAN上),并且速度稍快(10Gb与6Gb)。
哔哔声

就是说,我来看看MSA2040……不知道为什么它以前没有出现在我们的雷达上。
2014年

我可以看到混乱的情况...如果您不打算扩展到4或8台服务器之外,SAS会很好地工作。它不是10Gb对6Gb,而是10Gb对4通道12Gbps SAS(机箱为48Gbps)接口。
ewwhite 2014年

我刚刚看到Remote Snap软件只能在iSCSI或FC上运行……我们希望利用远程快照最终将SAN镜像以进行灾难恢复。还是通过SAS有另一个流程可以实现相同的功能?
哔哔声

@Beepbeep我可能会使用其他DR过程。我倾向于不依赖于存储设备或SAN级别的复制。但是MSA2040的10GbE和FC版本可能更适合您。
ewwhite 2014年

6

我用于磁盘IO的经验法则是:

  • SATA每个主轴75个IOP。

  • FC / SAS每个主轴150个IOP

  • 用于SSD的每个主轴1500 IOP。

除了每个阵列的 IOP之外还应考虑每TB的IOP。如果采用SATA + RAID6,以每TB的IOP比率非常糟糕的情况并不少见。这听起来可能不算太多,但是您最终会发现有人发现了阵列上的“可用空间”并想要使用它。人们通常会购买演出而忽略iops,而在大多数企业系统中情况恰恰相反。

然后增加RAID的写代价:

  • 2个代表RAID1,RAID1 + 0
  • 4个用于RAID5(或4个)
  • RAID6为6。

在适当的情况下,可以部分减轻较大的大型写缓存的写入损失。如果您有大量顺序写入IO(例如DB日志),则可以大大减少RAID 5和RAID 6上的那些写入损失。如果您可以写一条完整的条带(例如,每个主轴一个块),则无需阅读即可计算奇偶校验。

假设设置了8 + 2 RAID 6集。在单个写入IO的正常操作中,您需要:

  • 阅读“更新”块。
  • 读取第一个奇偶校验块
  • 读取第二个奇偶校验块
  • 重新计算奇偶校验。
  • 全部写入3.(6个IO)。

使用缓存的全条带写入-例如RAID条带大小的8个连续的“块”,您可以计算整个批次的奇偶校验,而无需读取。因此,您只需要执行10次写入操作-每个数据一次,两次奇偶校验。

这使您的写惩罚为1.2。

您还需要记住,写IO易于缓存-您不需要立即将其存储在磁盘上。它在软时间限制下运行-只要平均您的传入写入不超过主轴速度,它都将能够以“缓存速度”运行。

另一方面,读取IO受到时间的限制-在获取数据之前,您无法完成读取。那时,读取缓存和缓存加载算法变得很重要-可以预测和预取可预测的读取模式(例如顺序读取,例如从备份中获取),而随机读取模式则不能。

对于数据库,通常建议您假设:

  • 您的大多数“数据库” IO都是随机读取的。(例如,对随机访问不利)。如果您负担得起开销,那么RAID1 + 0很好-因为镜像磁盘提供了两个读取源。

  • 您的大多数“日志” IO都是顺序写入。(例如,对缓存有利,并且与许多DBA的建议相反,您可能想要RAID50而不是RAID10)。

两者之比很难说。取决于数据库的功能。

因为随机读取IO是缓存的最坏情况,所以SSD确实是它自己存在的地方-许多制造商都不会理会缓存SSD,因为无论如何它的速度都差不多。因此,特别是对于诸如临时数据库和索引之类的东西,SSD可提供良好的投资回报。


谢谢,我们是100%RAID10,因为我们专注于数据库。
哔哔声

这很常见,但这也是一个谬论。对于主要面向写入的工作负载,RAID10实际上非常浪费。进行写操作时(例如,写数据库日志文件),写的缓存RAID5 / RAID6的写惩罚要低。
Sobrique 2014年

3

您的分析是正确的。

为大量GB使用几个HDD,为几个IOps使用多个HDD。
为大量IOP使用几个SSD,为几个GB使用大量SSD

哪个对您更重要?空间是SSD解决方案的主要成本驱动因素,因为每GB的价格要高得多。如果您要谈论200GB数据库需要4K IOP,那么一对SSD将带您到那里。或由15个驱动器组成的24磁盘阵列,为您提供大量存储空间。

根据存储基础架构,实际从这些SSD中获得多少IOps会有很大差异(ewwhite将对此进行详细说明),但是获得这些速度是合理的。特别是对于Raid10,其中不计算奇偶校验。


感谢您的反馈!混合驱动器是否合理?即设置4个SSD来执行面向性能的任务,然后设置一堆用于大容量存储的HDD?
哔哔哔声

3
@Beepbeep是的,但是要注意一些折衷。大量iops将消耗控制器资源,这意味着您将无法从HDD获得最大的顺序吞吐量。HDD上的大量顺序吞吐量可能会使SSD中的IO拥挤,这是由于通道争用而导致的延迟增加。如果这对您很重要,但是它们在不同的渠道上。
sysadmin1138

0

我最近使用Dell C2100机箱为雇主搭建了一对存储服务器,该服务器运行FreeBSD 10.1,带有十二个2TB 7200rpm Western Digital“ SE”企业SATA驱动器。这些驱动器位于单个ZFS池中,该池由两个6驱动器RAIDZ-2虚拟设备(vdev)组成。与该池相连的是一对Intel DC S3500 SSD,它们具有超级电容保护,可防止掉电,它们既用作SLOG又用作L2ARC。通过iSCSI对该服务器进行负载测试,我能够达到7500-8200 IOPS。我们的总成本(包括硬盘驱动器)约为每台服务器2700美元。

在这些基于BSD的系统运行时,我们的HP MSA2012i SAN单元之一遇到了两个控制器故障,而我们的其他MSA2012i单元损坏了较大的NTFS卷,需要12个小时的停机时间进行维修。

戴尔和惠普向您出售10%的硬件和90%的支持承诺,使您永远无法使用。


的确如此。我的一部分希望推荐运行ZFS(或基于ZFS的设备操作系统)的HP服务器,因为它的性能要比MSA / P2000好得多...但是我不想放弃切线
ewwhite 2014年

哦,我对HP没问题。HP和Dell是出色的服务器硬件。通常,它的加载要好于某些白盒iStarUSA或Norco机箱。但是,对于关键设备(SAN / NAS在我的书中很关键),我建议一种解决方案,该解决方案应尽可能透明。SAN设备是大黑匣子。它们工作得很好,直到不起作用为止,然后您就变得小溪了。
阴极
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.