我正在考虑为我们的一个SQL Server群集使用RAID0设置。我将概述情况,并在寻找为什么这可能不是一个好主意。同样,如果您有用例,白皮书或其他文档的人,您可以在这个主题上向我指出,那就太好了。
我们在2个数据中心中有3台服务器,它们是SQL群集的一部分。它们都在可用性组中运行SQL Server。主数据库旁边有一个副本,另一个数据库中有另一个副本。他们正在运行具有自动故障转移功能的同步复制。所有驱动器均为企业级SSD。他们将运行SQL Server 2017或2019。
我认为与其他方法相比,在RAID0阵列上运行它们会带来多种好处,并且几乎没有真正的缺点。我目前看到的唯一负面消息是主服务器上缺乏冗余,因此失败率增加了。作为专家:
如果驱动器发生故障,而不是一直运行到慢速,降级的状态,直到有人收到手动操作的通知,服务器将立即失败,导致辅助服务器保持完整的操作能力。通知我们有关故障转移的更多好处,因此我们可以更快地调查原因。
它减少了每TB容量整体发生故障的机会。由于不需要奇偶校验或镜像驱动器,因此减少了每个阵列的驱动器数量。使用更少的驱动器,发生驱动器故障的机会就更少了。
这更便宜。需要更少的驱动器以达到我们所需的容量显然会降低成本。
我知道这不是传统的商业思想,但是我有没有在考虑什么呢?我会喜欢任何赞成或反对的意见。
我并不想这样做,以提高查询性能,但是如果有有意义的建议,请随时指出。我最关心的是无法考虑或解决我从未想到的可靠性或冗余性问题。
操作系统位于单独的镜像驱动器上,因此服务器本身应处于启动状态。这些驱动器之一可以更换并再次镜像。它很小,除了系统DB之外没有任何数据库文件。我无法想象这需要花费几分钟的时间。如果其中一个数据阵列发生故障,我们将更换驱动器,重建阵列,还原并与AG重新同步。以我个人的经验,恢复比RAID5驱动器重建快得多。我从来没有遇到过RAID1故障,所以我不知道该重建是否会更快。还原将来自备份,并前滚以匹配主数据库,因此,仅将最后几分钟的日志与恢复的副本同步,主服务器上的负载增加应该非常小。