RAM测试不一致-最可能的罪魁祸首是什么?(即我应该花什么钱来更换)


20
  • 主板:GA-B85M-DS3H-A
  • CPU:酷睿i5 4430
  • 内存:PNY XLR8 DDR3 32GB(4x8GB)1600MHz(MD32768K4D3-1600-X9)
  • 电源:EVGA 500 W1 80+

问题

安装了所有32GB的RAM后,系统始终无法使MemTest86 + 6.2失败。失败总是发生在第一遍中,并且错误迅速上升为数百万个错误。尝试运行Windows会导致随机重启和Stop错误(如RAM错误所预期的那样)。

我尝试过的

  • 测试插槽DIMM1中的单个8GB PNY模块。成功完成4次MemTest测试。
  • 测试插槽DIMM2中的单个8GB PNY模块。成功完成4次MemTest测试。
  • 测试插槽DIMM3中的单个8GB PNY模块。成功完成4次MemTest测试。
  • 测试插槽DIMM4中的单个8GB PNY模块。成功完成4次MemTest测试。
  • 在插槽DIMM1中分别单独测试所有四个8GB PNY DIMM。所有模块均成功完成4次MemTest的通过。
  • 在插槽DIMM1和DIMM2中测试两个8GB PNY模块。成功完成4次MemTest测试。
  • 在插槽DIMM3和DIMM4中测试两个8GB PNY模块。成功完成4次MemTest测试。
  • 在所有插槽中使用四个2GB已知良好的DIMM测试主板。成功完成4次MemTest测试。
  • 交换插槽中PNY DIMM的订购。不变-MemTest错误仍然会发生。
  • 将主板RAM电压从1.5v提高到1.65V。不变-MemTest错误仍然会发生。
  • 在设置实用程序中使用RAM手动设置的各种组合进行操作-启用/禁用XMP配置文件,设置“增强的稳定性”预设等。没有更改,MemTest错误仍然发生。

我认为我可以安全地排除损坏的RAM和损坏的RAM插槽。该唯一的MemTest这个测试失败的时间,如果所有四个8GB模块同时安装。

我已经测量了从PSU流出的电压,即使安装了所有四个摇杆,那里的所有部件也看起来很稳定。

在撰写本文时,我尝试了在BIOS中手动将RAM速度降低至1066MHz的最后选择。到目前为止,MemTest已完成一遍,第二遍没有任何错误。(以上所有测试都是在1600MHz RAM原始速度下进行的。)这可能使我可以使用该系统,尽管RAM速度稍慢,但这似乎不是永久性的解决方法。

每当发生MemTest错误时,它们总是在64位地址总线上的相同位置发生:

Bit Error Mask: 00000000FF000000

此外,永远不会在4GB的限制以下发生错误。换句话说,所有错误都发生在4GB到32GB之间的地址空间中。

我推断这是与CPU,RAM和主板的某种奇怪的交互或时序问题,因为错误非常一致,仅在一种特定的配置中发生,并且似乎可以通过减慢RAM来缓解,并且仅发生在4GB以上的障碍。我的问题是:我的CPU或主板更有可能是罪魁祸首吗?

我一直打算将这台机器升级到Core i7-4790K,所以如果CPU可能是罪魁祸首(我知道在这些较新型号的CPU中,内存控制器位于CPU上),那么它工作得很好,因为我打算进行升级无论如何,但我想知道主板本身是否也可能是问题的一部分。即我不想只花钱在i7 CPU上来体验完全相同的问题,并且发现我也必须更换主板...

忠告?


编辑:较慢的RAM速度仍然会产生错误,但只有在测试达到第三次通过之后。我仅在一个CPU处于活动状态时重新启动了测试,只是为了测试CPU本身上的交互。


确认它是内存,主板还是CPU的唯一方法是在另一个兼容的系统中测试ram。
摩押

2
如果在移动RAM芯片时问题仍未解决,则说明主板在扔。
约书亚

1
当您在双内存中运行此内存时,或者在其中有4(8g)个模块运行时,可以将其从SPD(自动)中取出,并稍稍调整一下计时,使其正常工作。说它是10,11,10,24调整到11,12,11,32并像这样测试。(是的,这是猜测)如果100%不间断运行,则不太可能是发热量或主板问题。使用4x8gig模块的人遇到过您之前描述的问题,如果有电压调节支持,并且cpu没有弯曲的针脚,这可能是一种使不在兼容性列表中的东西正常工作的方法。因此,请进行测试并返回给我们。
Psycogeek '16

2
“较慢的RAM速度仍然会产生错误,但是只有在测试到达第三遍时才出现”。在任何一个过程中,您是否要采取额外的步骤来测试柱塞的冷却?即使是临时增加的风扇或外部风扇,也可以使空气流过冲头及其调压电路,这些东西也可以进行测试,以查看热量是否是问题之一。
Psycogeek '16

@Psycogeek +1表示建议修改时间。就时间安排而言,某些RAM模块不能很好地与其他RAM模块配合使用(即使是相同品牌或模块类型)。我遇到了与OP类似的问题,并通过手动设置计时来解决。
Amziraro

Answers:


18

这听起来好像没有任何组件有缺陷,但您使用的是不兼容的组合。

在同一条存储器总线上安装多个插槽会增加每条数据线上的电容并减慢上升时间,这可能会导致转换延迟到达并被错误检测。电气工程师将此现象称为“扇出”。

由于存储模块内部的扇出,这使情况更加复杂。模块上DRAM设备的数量和拓扑(称为“等级”)将影响您可以成功成功并行连接的模块数量。

支持大量内存插槽的服务器主板实际上需要缓冲的内存,该内存使用级联的缓冲区网络来限制每个风扇看到的扇出(并因此限制电容)。缓冲器本身会引起延迟,但延迟只会随着负载数量呈对数增加,而对于无缓冲存储器,电容会线性增加。

维基百科对此进行了讨论:https//en.wikipedia.org/wiki/Memory_rank

某些主板手册实际上将这种情况称为“事实”。对于其他用户,您可以从RAM兼容性列表中推导出信息。例如,华硕Z170-A主板显示双列(在手册中称为DS =双面)只能在该板上一次在两个插槽中使用,而不是一次使用四个单列DIMM的能力。 。

在此处输入图片说明


假设这是造成问题的原因,那么这将有助于关闭SPD并稍微更慢地调整定时设置以补偿较慢的上升/下降时间吗?
brhans 2013年

1
我不确定这是否正确。消费者Haswell处理器通常每个通道支持四个内存等级,足以在两个内存通道中允许四个双面模块。为什么会是这个问题?这似乎也不能解释问题仅在4 GB障碍以上发生的事实。此外,主板手册指出底层的B85芯片组支持32 GB内存,并且未提及有关内存等级的任何限制。
bwDraco

2
@bwDraco:即使内存控制器在CPU上,主板也很重要。PCB布局可能会影响它,不理想的长度匹配会降低信号的相位裕度(这也是为什么错误与某些字节或位位置相关的原因)。主板手册中没有提到等级,并不意味着支持所有组合,仅表示这是一本废话,没有详细介绍。
Ben Voigt

1
@brhans:与时序参数无关,而是内存时钟频率,因为问题出在CPU与DIMM之间的传输中,而不是DRAM内部。SPD通常具有许多与不同时钟频率相对应的配置文件,选择其中一个不同的配置要比完全手动配置更好。
Ben Voigt

1
绝对像是主板信号完整性问题。较大的模块可能比较小的模块每个引脚具有更高的电容,尤其是如果模块本身是双列的。当您完全填充等级时,这可能恰好导致此问题。一个模块可能有多个等级。因此,每个通道四个等级很容易成为两个双等级高密度模块。电气特性和主板上走线的走线可能会加剧这种情况。我的建议:尝试另一块主板。
alex.forencich 16-03-28

9

这听起来像是处理器的集成内存控制器中的问题

在现代系统中,母板除了在内存模块和处理器之间提供路径外,并没有真正在内存管理中发挥作用。内存直接连接到处理器,以最大程度地减少延迟。在较旧系统中将内存连接到处理器的“ 北桥 ”现在已成为处理器本身的一部分。(固件或PCH可以控制处理器运行RAM的方式,但是导致您描述的这种类型的位错误最终由处理器负责是没有道理的。)因此,我要做的第一件事是d在这种情况下怀疑是IMC有故障。

实际上,如果您将主板或系统固件归咎于您遇到的问题,我会感到非常惊讶。


弯针呢?
迈克尔·汉普顿

6
@Michael:弯曲的针脚也会导致测试单个模块失败。
Ben Voigt

4

我看到该主板上的BIOS有一些不好的评论。我将从检查BIOS更新开始。切勿在主板上ski脚。


BIOS是最新的。诚然,RAM不在“合格”列表中,但它的计时与那里列出的许多其他模块相同。
fdmillion's

我会考虑更换主板。它不一定是最重要的,只需从您可以承受的价格范围开始,然后寻找评论最多的人(也请阅读它们)。拥有最大用户群的用户更有可能对BIOS和芯片组更新提供长期支持。
Atoadaso '16

您是否检查过该主板是否能够同时正确处理32 GB的内存?另外,您可以在主板上找到内存管理器芯片,并查看它有望能够正确处理的内存量。
milesrf '16

1

RAM可能也会发生故障,即使看起来可能不是。我的家庭服务器最近遇到一个问题,其中包括一杯冰茶的致命事故……

我完成了单独更换每个部件的整个过程(2个CPU,主板,电源和2个16 GB(2x8GB)RAM的存储体),并且当我仅使用单个RAM和单个CPU进行测试时,一切工作正常1个CPU(这是吐司)。

我使用哪种配置都没有关系,当我只有一个CPU和一堆RAM(无论是16GB还是32GB RAM)时,它总是可以工作,但是当我放入第二个CPU并拆分RAM时,它就是16GB对于每个银行,服务器无法启动。

直到我完全更换了一块RAM之后,它才最终启动并正常运行,并且一直以来都是如此。

tl; dr:正如@moab在其评论中所述,在测试兼容系统中的每个组件之前,您永远无法确定

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.