我被告知接受Memtest86 +的一个错误


52

八月份购回了一台具有4x4 GB RAM的新计算机。RAM出现问题。他们给我寄了四根新木棍,它们也产生了错误。挑出四根棍子(从我现在拥有的八根棍子中),它们不会产生任何错误。上周偶然发现了一个新的RAM错误(这次没有BSOD)。与公司联系。据他们说,去年夏天以来存货一直存在问题,所以我收到了两支经过测试的8 GB记忆棒。周末一直在运行Memtest86 +。20小时后,我收到一个错误消息(请参阅所附照片)。该测试现在已经运行了37个小时,但到目前为止只有一个错误。我联系了购买计算机的公司。他们回信:

我不会担心一顶帽子失败了。

我们在这里遇到过类似的情况,它经历了无数次,但随后失败了一次。我们认为这是memtest的问题,在所有内存出现故障或不是之后,您就无法真正让它通过几次,再次失败,然后再次通过!

请相信我,继续我们发送给您的记忆,如果您的问题仍然存在,我们将考虑再次更换它。

我从其他论坛帖子中发现,很多人不接受一个错误。这个单一错误可能表示什么意思,错误的RAM或MEMTEST程序(或其他程序)中的故障?

更新:从下面的有用评论中,我得出结论,偶然的(很少见的)“随机”错误可能会发生并且可以接受,但是在同一地址重复出现错误将表明出现故障。Memtest现在已经运行了45个小时,但我仍然只有一个错误。对于所有人的信息,我将继续运行测试。在不到两天的时间里,我要离开一个月。我很可能会离开Memtest。由于我没有UPS,因此停电可能会破坏实验。电脑是台式机,所以我无法随身携带(奇怪的是,随着我飞行,它会暴露于更多的宇宙射线中)。

记忆测试


+1; 就我个人而言,我认为这是一个很好的问题,很抱歉我不能为您提供答案。我对您的问题进行了小幅更新,以确保它不是主题!
戴夫

19
我个人不会冒一个错误,只有一个会失败...对RAM进行非错误纠正有时会出现问题,这不是完美的。现在,如果您可以在相同的地址范围内进行复制,则说明存在问题。
井2012年

非常简单。您发布的错误意味着你的内存是不是在给定的地址保持正确的价值
Ramhound

4
您确定这不是您的计算机损坏了ram吗?
桑尼·辛

5
同意@Shinrai-如果偶尔出现间歇性故障且RAM正常,则没有机会进行RAM纠错。在同一地址重复出现错误是另一回事,这将表明存储单元有故障。
jg-faustus 2012年

Answers:


41

直接来自Memtest86作者。我会推动他们取代它。确实应该没有任何错误。

如果您的失败地址数量相对较少,并且只有一位或两位错误,则可以确定错误是有效的。间歇性错误同样无一例外地有效。内存供应商经常质疑Memtest86是否支持其特定的内存类型或芯片组。Memtest86设计用于所有内存类型和所有芯片组。

所有有效的内存错误都应得到纠正。在正常操作中可能永远不会出现特定的错误。但是,使用边际内存有风险,并且可能导致数据丢失甚至磁盘损坏。即使没有明显的问题迹象,您也不能认为系统不受影响。有时,间歇性错误可能会导致长时间不显示的问题。您可以确定,如果您知道内存错误并忽略它,墨菲将帮助您。


4
您省略了暗示“有效”的狭窄定义的部分:“经常有人问我们Mestest86报告的错误的可靠性。在大多数情况下,测试报告的错误是有效的。有一些系统会导致Memtest86对内存的大小感到困惑,它将尝试测试不存在的内存。这将导致大量连续地址被报告为错误,并且通常会有很多错误位。”
horatio 2012年

3
他的意思是有效的,因为“间歇性错误是真实错误,而不是Memtest的产物”。但这并不一定会转换为错误的RAM。发生间歇性RAM错误,这就是为什么存在诸如纠错RAM之类的原因。Google在其服务器上对其进行了测量:“平均DIMM每年会遇到近4000个可纠正的错误”。另请参见ZDNet
jg-faustus 2012年

28

好像只有一个位在该地址被破坏(即,在预期时未设置为逻辑1)。 如果您可以重现该错误,则RAM出现故障。 即使是可重现的1位错误仍然是错误,并且在使用计算机时可能会引起问题。

正常工作的内存应该*绝*不会出现计算机所期望的任何错误(这就是为什么当内存不足时它们会崩溃,作为保护措施;您不能可靠地运行内存不足的计算机,因为计算机可能执行已损坏)说明或提供/存储损坏的数据)。


*在足够长的时间跨度内,DRAM位有可能因诸如背景辐射之类的外部来源而损坏;该事件通常很少见,大多数计算机运行Memtest数而不会出错。另请参见堆栈溢出问题,“ 宇宙射线:它们将影响程序的概率是多少? ”。


到目前为止,没有更多错误。测试仍在运行。在这一点上,可能只有一个假想的问题:“这是我在运行测试一周后唯一遇到的单个错误吗?”
DustByte

6
@DustByte然后我认为这很好。如果相同的错误发生在相同的存储位置,这将是一个问题,这将指示有故障的DRAM单元。许多事情都会改变RAM的错误率,包括背景辐射(例如来自宇宙射线风暴或其他辐射源的辐射)。
突破

5
在一个实例中,Fermilab在多台组合了160 Gbit的计算机上每天测量2.5次“单个事件失败”。他们将其归因于背景辐射。在这种情况下,海拔高度至关重要:科罗拉多州博尔德市会比死谷地区更频繁地看到这种情况
horatio 2012年

这个堆栈溢出问题真的很精辟-我没有意识到错误率由于宇宙辐射是相当的是高的。
井2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.