如何强制ECC错误[关闭]


10

我正在寻找一种方法来强制DRAM DIMM中的ECC错误,以测试与从这些错误中恢复相关的一些代码。我相信英特尔制造的测试夹具价格为几千美元,但我正在寻找便宜的东西。

我尝试购买连接到DIMM的Beta发射器(Strontium 90,0.01uCi),以强制硬件发生“位翻转”。经过两周的运行,我没有收到任何ECC错误的报告。

我的下一步是购买更强的发射器...或看看是否有人解决了此问题。

问题:有没有人找到一种方法来强制进行DIMM中的ECC故障以进行测试(除了找到有故障的DIMM并使用该方法以外,这是我们的旧技术,直到DIMM完全消除虚影为止)。


1
您将需要比这更强大的功能。弹出Fermilab,看看他们有什么。:)
迈克尔·汉普顿

4
我投票关闭此问题为离题,因为这不是系统管理问题。它适合迁移到另一个SE站点,尽管我不完全确定哪个站点合适。
卡巴斯德(Kasperd)'16

2
这些错误注入示例有帮助吗?还是您需要真正的硬件故障?
ckujau

1
使用某种类型的虚拟化层可以模拟ECC错误吗?只是一个想法
Molomby '16

2
@Molomby会的。虚拟机的故障注入是CS中的一门研究学科。这些年来,已经发表了一些体面的著作。
the-wabbit '16

Answers:


1

通过将导线添加到单个DIMM(销毁该电缆以正常使用)并通过DIMM产生随机ECC错误,从而使我们能够测试系统,从而解决了该问题。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.