镜像模式RAM:是否值得?


18

对刀片服务器设置的英特尔“镜像通道模式”不是很熟悉(您的典型中等重量的MySQL OLTP数据库在裸机刀片上运行;目前没有虚拟化)。

从英特尔文档中,我能够找到:

Intel Xeon Processor 5500系列和Intel Xeon Processor 5600系列支持通道镜像,以在镜像配置中配置DDR3 DIMM的可用通道。镜像配置是内存的冗余映像,即使存在零星不可纠正的错误,它也可以继续运行。通道镜像是一种RAS功能,其中保留了两个相同的内存数据映像,从而提供了最大的冗余度。

在基于Intel服务器主板的Intel Xeon Processor 5500系列和Intel Xeon Processor 5600系列处理器上,跨通道实现了镜像。活动通道保存系统映像的主映像,其他通道保存系统内存的辅助映像。Intel Xeon Processor 5500系列和Intel Xeon Processor 5600系列处理器中的集成内存控制器在两个通道之间交替进行读取事务。在正常情况下,写事务会同时发布到两个通道。

但是,我并没有真正了解他们在这里躺着的东西。我失去了一半的存储容量,但获得了“冗余”内存并可能获得读/写性能优势?像RAID 1的RAM吗?有人对此配置有任何实践经验吗?

Answers:


7

就我个人而言,我会尽快使用某种形式的群集,而不是使用那种级别的硬件弹性。对于像磁盘这样的廉价组件来说,将它们加倍是有意义的,但是镜像内存是一个不错的选择,但没有那么有用。我的意思是更有可能失败;CPU,操作系统,软件,主板,PSU。我会尽快把钱花在集群上。


1
我的想法很准确:尽管对于特定的故障点肯定很有用,但我可以通过与另一个或两个刀片(可能还有另一个数据中心的另一个机箱)一起走集群路线,从而勾勒出更多的HA“盒子”。
gravyface 2011年

1
当必须按计划或在tineframe中进行计算时,聚类将无法为您提供帮助。在某些情况下的故障转移时间比操作不再需要被执行
吉姆乙

7

“ RAID 1 for RAM”是准确的描述。以我的经验来看,性能没有太大好处,但是根据总线速度与模块速度的不同,您的行驶里程可能会有所不同。

就冗余而言,..好,很少有模块坏了。

就个人而言,我一看到启用镜像就关闭它。


2
谢恩。之前/之后是否进行过基准测试?
gravyface 2011年

@gravyface不幸的是,我不能说我有。只是没有注意到在打开和关闭(在数据库服务器和vm主机上)之间是否有明显的性能差异。一些硬数字肯定会很好。
Shane Madden

2
那我要做一些基准测试。看看是否有所作为。不能说纠错好处听起来像是切实的好处,但是我很好奇它的表现。我将等待几天,以获取其他答案,然后将其标记为正确。
gravyface 2011年

我看到调光确实变坏了,但是考虑到环境的大小,我应该每2周看到1个调光(从统计上来说)
Jim B

4

我读过这种事情(您也可以使用CPU来完成)在庞大的超级计算机集群中非常有用。

这些群集中的一些正在运行的计算机如此之多,以至于每隔几个小时就会出现一次计算机故障。比作业可以完成的速度更快。这确实弄乱了计算。向每个节点添加这样的冗余可以使两次故障之间的时间增加一倍以上。


因此,我认为这是现在流传至主流的高端产品。不能真正满足我的需求。不过谢谢
gravyface

是的,这是高端产品。等到您在计算机上获得热插拔CPU的CPU和CPU镜像(!)时;)当一个主机发生故障时,大型机可以切换到另一CPU。
TomTom

3

这种内存模式实际上是为需要高可用性的情况而设计的。您应该不会看到太多的性能差异(因为在正常操作下,一个通道的丢失可能并不明显),但实际上却损失了很多内存。启用镜像后,只有三个总内存可用,因为两个DIMM插槽是主通道,两个DIMM插槽是备用通道,并且不使用两个DIMM插槽。(至少这是IBM上的方式)

我通常建议关闭它(如果您有一个喜欢ram的应用程序或操作系统-让我们面对现实:是否有不支持ram的东西?)或保存下来以从IBM升级到ex5芯片组(惠普和其他很快就会升级)并提供类似的产品),从而增加了更多的QPI。

偶尔会出现“无论服务器向其发射多少张照片,都必须启动它”,这种类型的冗余有助于解决问题。另外,您购买的产品质量不及恒星ram,这可能会使您免于蓝屏或2。


是的,现在没有太多需要。显然没有人喜欢停机,但是当我们处理HA时,我们肯定会在研究群集。
gravyface 2011年

1
这是对您“每两周看到一个坏的DIMM”的回应–在宽限期内,您经常看到坏的DIMM吗?我不记得曾经生产过RAM不好的东西。我通常会在一般工作量的头几个小时/天注意到它。
gravyface 2011年

我们的结果反映了Google看到的cs.toronto.edu/~bianca/papers/sigmetrics09.pdf的比率。我们已经对服务器进行了类似的配置-充满很多调光的满载电路板,以及占用大量内存的应用程序。在查看我的vmware环境中的一个时,我发现18个完全填充的IBM hs22vs(324个调光)中有3个坏调光。这些服务器已经使用了大约一年。
Jim B
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.