如何诊断计算机锁定和死机?


29

几年前,我用以下规格构建了台式计算机:

  • CPU: Intel Core 2 Quad Q9300 Yorkfield 2.5GHz 6 MB L2缓存LGA 775 95W四核处理器BX80580Q9300
  • 主板: EVGA 122-CK-NF68-T1 LGA 775 NVIDIA nForce 680i SLI ATX Intel主板
  • 显卡:两个EVGA 256-P2-N758-TR GeForce 8600GT SCC 256 MB 128位GDDR3 PCI Express x16 SLI支持的显卡
  • PSU: SeaSonic S12 Energy Plus SS-550HT 550W ATX12V V2.3 / EPS12V V2.91 SLI认证CrossFire Ready 80 PLUS认证有源PFC电源
  • 内存:两个G.SKILL 4 GB(2 x 2 GB)240针DDR2 SDRAM DDR2 800(PC2 6400)双通道套件台式机内存F2-6400CL5D-4GBPQ

自诞生以来,该机器已定期锁定,多年来的规律性从每天一次到每月一次不等。通常,锁定每隔几天发生一次。

“锁定”是指我的计算机死机。屏幕锁定,我无法移动鼠标。敲击通常可以打开或关闭键盘上的LED的键盘上的键(例如Caps Lock)不再打开或关闭LED。如果在锁定时播放音乐,则扬声器中会不断散发出噪音,但只是当前频率/音符会无限期播放。没有BSOD。

当发生这种锁定时,我必须通过关闭计算机或单击重置按钮来进行硬重启。

我拥有NVIDIA硬件驱动程序的最新版本,并定期进行更新,但这似乎无济于事。我当前使用的是Windows 7 x64,但以前使用的是Windows Server 2003 x64,并且存在相同的锁定问题。

我的猜测是,这与视频驱动程序或主板有关,但是我不知道如何诊断该问题以缩小两者的罪魁祸首。


有关冷却的其他信息: 关于冷却...除了从一台旧计算机上扫过的两个常规风扇外,我没有安装任何售后冷却系统。CPU顶部的风扇是它附带的风扇。我添加了两个扫气风扇之一,它位于角落的底部塔架上,以尝试产生从前到后的气流。第二个风扇直接指向两个视频卡。


SpeedFan安装和读数 根据studiohack的建议,我安装了SpeedFan,它提供以下温度读数:

  • GPU:63C
  • GPU:65C
  • 系统:76C
  • 处理器:64C
  • 辅助:36C
  • 核心0:78C
  • 核心1:76C
  • 核心2:79C
  • 核心3:79C

更新#3:另一个 锁定:-(好吧,我昨晚又进行了一次锁定。

我注意到的一件事是,如果我正在观看视频,似乎更可能发生冻结。实际上,在过去一个月的最后5次冻结中,其中4次是在Flickr上观看视频时出现的。不一定是相同的视频,但是仍然是一个视频。我不知道这仅仅是巧合还是有什么意义。(顺便说一句,每天晚上睡前,我2岁的女儿坐在我的大腿上,在Flickr上观看一些家庭录像,并且在上个月学会了“呃,电脑坏了。”)


更新#4:MemTest86和3DMark06测试结果

根据评论中的建议,我将MemTest86运行了一整夜,它在8 GB内存中循环了5次,没有错误。我还没有问题地进行了3DMark06测试(请参阅http://3dmark.com/3dm06/15163549上的分数)。

所以现在怎么办?:-)

关于检查内容还有其他建议吗?当计算机那样锁定时,是否有某种方法可以获取堆栈跟踪信息?

解析度

我从来没有弄清楚具体的问题,但是根据这里和其他地方的建议,我认为这是主板问题。无论如何,我最近都升级了系统,购买了新的Motherbeard,PSU,CPU和RAM,并且该新设备在过去几周中一直表现出色。我使用的是与旧设置相同的图形卡,因此我认为可以确定它们不是问题的根源是安全的。


首先想到的是热量...如何保持系统凉爽?
詹姆斯·默茨

@KronoS:我编辑了问题以包括冷却情况。请注意,我没有使用任何CPU温度监控软件。
Scott Mitchell 2010年

2
您应该安装SpeedFan并让我们知道它们的温度...
studiohack

@studiohack:感谢您的建议-我下载并安装了SpeedFan并编辑了问题,以包括这些新读物。这些温度读数正常吗?
Scott Mitchell 2010年

2
@Scott下载3dMark '06和FurMark让它运行几个小时。报告任何崩溃。如果确实崩溃,则一次只能使用一张视频卡
Sathyajith Bhat

Answers:


11

根据您发布的温度和冷却方式判断,您的计算机过热了,这是要纠正的第一件事。在空闲负载下使用64 C是不可接受的,在满负载情况下实际上并不是首选。每当我的CPU超过35时,我都会有点偏执,但实际上,50应该是您的最大负载。

为您的系统投资一个好的散热解决方案。一个相当不错的系统只会让您花费20到30美元。如果您正在寻找所需的帮助,请参阅《 Tom's Hardware低于40美元的散热解决方案》。

另外,您可能希望启用“死亡蓝屏”(听起来很可怕),以便调试有问题的锁定。这可以通过以下方式完成:

->在开始菜单中右键单击“计算机”

->选择“属性”

->选择“高级系统设置”

->选择“高级”选项卡

->选择“启动和恢复”

->确保已启用“将事件写入系统日志”。

有时,有些清洁程序会自动阻止BSOD的录制(Advanced System Care),您可能想研究防止这种情况的发生。检查完此问题后,建议您使用NirSoft的BlueScreenView查看崩溃详细信息/调试相关问题。

最后,我将检查并重新检查您的PC和所有连接。我实际上也有类似的情况,发现内部主板USB电缆之一连接不正确,从而引起了问题。

更新资料

我整理了一些有关一般故障排除和崩溃或冻结诊断的问题。请同时参阅它们,因为它们也可以帮助您搜索问题。


@KronoS:您是否有共享的推荐冷却系统?
Scott Mitchell 2010年

@ScottMitchell ...更新的答案。我强烈建议您进行研究,尽管每个超级用户的情况都不同。
詹姆斯·默兹

3
@ScottMitchell我建议您在添加任何外部冷却之前,先更改热界面材料(TIM或导热膏)。另外,检查风扇/格栅/通风孔上是否有灰尘覆盖,并使用压缩空气罐将其清除。
Sathyajith Bhat

@Sathya:谢谢你的建议。上周,我破译了案件,在开着案件的情况下,计算机运行了一天,工作温度降至40年代。今天早上,我检查了CPU的现有冷却系统,发现风扇下的格栅上有很多灰尘,所以我清理了一下。我把箱子放回去,我们将看看温度是否保持在低水平,这是否有助于防止以后的冻结。(如果是这样,我将标记为答案...)
Scott Mitchell 2010年

@Scott Ah很高兴听到您的消息,请及时告诉我们。
Sathyajith Bhat

5

硬系统死机(无法使用CTRL + ALT + DEL之类的热键)是由挂起的驱动程序引起的,
因此您必须更换设备或更新驱动程序。可以进行故障排除:

  1. Windows性能分析工具为您的Windows版本下载设置。
  2. 在系统上安装软件。
  3. 以管理员身份打开命令提示符,然后复制并粘贴下一个命令:

    xperf -start perf!GeneralProfiles.InBuffer && timeout -1 && xperf -stop perf!GeneralProfiles.InBuffer myTrace.etl
    
  4. ENTER 一次启动命令,现在您将不得不等到系统挂起。
    您可以做任何您想做的事。请不要进行诸如游戏或私人物品之类的繁重活动...

  5. 系统停止挂起后,立即转到控制台并按ENTER
  6. 等待一段时间后,将生成日志文件myTrace.etl,将其压缩为zip文件。
  7. 将此文件的压缩版本放在某个在线位置(也许2shared)。
  8. 在此处共享链接,我将尝试查找并向您显示问题的原因。

11
问问题:步骤5-如果在重新启动计算机之前系统从未停止挂起,该怎么办?
Scott Mitchell

@ScottMitchell:在这种情况下,请尝试创建一个手动故障转储
塔玛拉·威斯曼

4

如果距离计算机制造已经过去了两年,那么彻底清洁将是一个好方法。清除风扇,散热器,面板和角落的所有灰尘。最重要的部分是CPU散热器和风扇。压缩空气可达到此目的,但从长远来看,真空吸尘器可能更健康。彻底这样做将大大减少通风并减少热量。

除非将新计算机放在非常温暖且通风不良的房间(或机柜)中,否则新计算机应该不会出现热量问题。CPU制造商预计他们的产品将在各种条件下使用,甚至还制造了备用的散热器和风扇以使产品能够在大多数情况下工作。

自从您在构建它以来就遇到了问题,我倾向于倾向于其中一个组件的故障。基于上述问题,仅根据我自己的经验,我倾向于出现故障的主板。


1
正如我在问题中指出的那样,自从我构建计算机以来,这种冻结问题一直在定期发生。可悲的是,这不是最近发生的事情。
Scott Mitchell 2010年

正确。这就是为什么我倾向于故障设备而不是热量的原因,因为热量在您初次建造设备时就不成问题了(除非您将计算机放在非常热的地方)
Xantec 2010年

构建系统时,热量可能是一个问题。我们曾经收到一家主要制造商提供的双处理器工作站,其处理器风扇连接到另一个处理器的主板风扇针脚。...但是在这种情况下,问题不太可能出现。
Mike Chess 2010年

1

我去年经历了这个过程。

第一件事是确定它是硬件还是软件。这意味着在其上运行两个不同的操作系统。就我而言,我的主要安装程序是linux,它被随机冻结-与您描述的类似。有时每5分钟一次,其他时间则持续几天。

我最终在上面安装了Windows,但遇到了同样的问题。当我重新启动时,并且在发布期间挂起时,我退回了MB,此后没有出现任何问题。

作为调试过程的一部分,我还尝试了其他视频驱动程序-通用的非加速驱动程序没有经常冻结。我也安装了temp。监视实用程序,并查看日志以查看冻结之前是否发生了任何常见的情况。由于它是硬件,而且显然是随机的,所以我从未找到任何可靠地引起问题的方法,但这应该是您的目标。


我不确定您在这里的建议吗?
詹姆斯·默兹

如果硬件有问题,则无论操作系统如何,都会出现该问题。如果仅在一个操作系统上显示,而不在另一个操作系统上显示,则它很可能是软件。
克里斯,2010年

1
@chris:自从我制造计算机以来,问题就一直存在。最初,我使用Windows Server 2003,后来又升级到Windows7。在这两种操作系统下,我都遇到了这些冻结/锁定。
斯科特·米切尔

@Scott-您是否也在监视GPU的温度?如果多个操作系统遇到相同的问题,我会倾向于使用硬件,尽管我猜两者都使用相同的视频驱动程序。您是否尝试过删除其中一个视频卡,并查看是否可以将其缩小到特定的视频卡?
克里斯,2010年

1
好吧,如果您假设不是视频卡,那将留下内存,主板或软件。如果您由于看到Win7和Win2003的问题而排除了软件(我不会),则会留下内存或MB。您可以换出RAM吗?
克里斯,2010年

1

我首先怀疑电源。尝试用更高功率的设备更换它,看看情况是否变得更稳定。可能是电压轨在负载下有点下垂,这解释了为什么视频播放中它经常出现。

要测试该理论,您需要一个准确的电压表和一些基本的电气技能,但是鉴于备用电源的实用性,我很想换一下看看。


1

根据您的3号更新和38°C的锁定,主板/ CPU的热量并不是根本原因。假设您仅添加了视频卡,而没有其他附加卡(我曾经有一个NIC可以这样做!),那么我按最有可能的原因提出以下建议:

  • 将视频卡更换为其他已知的合格卡进行故障排除。买一个,借一个,随便什么。如果仍然无法解决问题,请转到下一个项目符号。

  • 您提到了更新视频卡驱动程序,但没有其他。确保所有可能的驱动程序确实都是最新的。我有一次网卡可以完成此操作,而我要做的就是更新驱动程序。

  • 如果确实没有任何其他附加卡(如果有,请立即将其卸下),请禁用BIOS中的所有可选设备。我的意思是说,您的机载声音会局域网并拉出任何USB项目。然后,看看它是否消失。

我会四肢冒昧地说90%的肯定是可以通过做第一个项目符号来解决。



0

听起来硬件或驱动程序是这里的问题。尽管由于您的计算机上有两个不同的操作系统,所以我倾向于使用硬件。

然后,从最简单的内容开始进行该假设。我看到您运行了Memtest,虽然那很棒,但并不一定排除了内存的可疑性。因此,请尝试以下操作:取出除一根记忆棒之外的所有内存,然后查看是否锁定。如果运行良好一段时间,则再放一个,依此类推,直到再次遇到问题为止。如果仍然锁定,请尝试在其他插槽中使用其他摇杆。如果仍然锁定,则移至其他硬件组件。

有人提到尝试换出您的视频卡,我同意。买一个便宜的,或从朋友那里借一个,然后试试。用电源做同样的事情。您的PSU看起来不错,但是它们确实变质了,值得更换并查看是否可以解决您的问题。

如果所有这些都失败了,那我就说更换主板。特别是因为您说过,自您第一次拥有计算机以来,就遇到了问题。

为了安全起见,最后要检查的一件事。在硬盘驱动器上进行chkdsk / SMART测试。他们可能很好,但仍然值得检查。


0

从您的描述看来,问题出在主板上。可能是您的北桥有问题(主板图)。我还要检查的是时钟发生器的BIOS配置和CPU速度。(我不知道您的主板,但也许它具有一些超频功能。)也许这些问题总是在高负载且CPU试图运行得更快时发生。


0

我要在这儿走动,并建议罪魁祸首是一个不能提供电荷来消除电流波动误差的烧断电容器。我猜测足够大的波动将导致系统死机但保持运行状态。

根据过去的经验,我会将责任归咎于电源设备(PSU)中的电容器烧断,但我建议您检查计算机中,主板内外的所有电容器,尤其是北桥周围的电容器。如果您超频了,那么主板很可能被炸了。尽管不可能将任何电容器吹到散热器下,但这也有可能。

如果您没有发现主板上有任何异物,我将为您的PSU保修,因为某些产品具有很长的保修期-我的7年-因此,除非您知道自己不在保修范围内,否则请勿打开它进行检查。如果只是一个电容器,就可以使用正确的工具来固定一个体面的电源。


-1

我已经处理过许多这样的情况,而我发现锁定或冻结时最常见的问题是散热膏。您的风扇可以做任何想做的事,但是如果在散热器和CPU之间留有空隙,则散热器将不会冷却两者之间的空气。如果该浆糊太干或在不适当或不充分的地方,或者不允许在处理器和水槽之间进行导热连接,则它将锁定,因为它会打开处理器本身的处理器保护电路。 。做五到六遍,直到问题解决。最终,或者我们将把您的处理器扔掉,甚至在不告诉您的情况下向您发送新的处理器。我们不想更换您的CPU。在这样做之前,我们要做10次。


1
我可以相信您可能知道您在说什么,但我不明白您在说什么。请修改您的答案以澄清-我已经开始了。例如:“做五到六次……” –做些什么?“我们做10次……” –做什么,谁是“我们”?另外,请澄清您在说Sathya♦在他于2010年12月10日21:36发表的评论中尚未说过的话。
Scott

-1

这可能是驱动程序的问题-每当它要处理您的视频时,它很可能会崩溃(它也可能发出怪异的噪音),因为屏幕冻结了-CPU可能仍然可以工作-实际上一切都可以工作-您可能只是无法看到鼠标/键盘操作的结果,因为一旦驱动程序崩溃,就没有任何东西可以处理输入的视觉表示。

潜在的解决方案:更新驱动程序,如果在将驱动程序更新为以前的驱动程序时启动,并且图形卡已旧-尝试购买新的驱动程序-有时在旧卡上安装了新驱动程序后,它们可能会出现故障。

仅当您的卡使用其制造功率的110%时,过热才是真正的问题,但如果仅您将其​​大幅提升,则会再次引起崩溃。


多数民众赞成在一个猜测,虽然一个体面的。但是也可能是电源,单个组件出现故障,CPU之外的其他地方(GPU,硬盘驱动器)发热。这也可能是一个错误的安装。
法国的Austin T

-2

我同意Nori进行SMART测试。使用(免费版)HDTune复制SMART属性。同时执行错误扫描。一个损坏的扇区可能会引起您所描述的问题。过热通常会导致BSOD并强制重启或关闭。因为它是“冻结的”,所以在我看来,这更像是硬盘驱动器问题(即使坏的硬盘驱动器也可能导致BSOD)。

检查SMART状态并记下“开机时间计数”数据。如果数小时后计数没有增加,则SMART属性可能被冻结,并为您提供假的“ OK”状态。

还要检查Windows系统和应用程序事件日志中是否有错误。

(控制面板->管理工具->计算机管理->事件查看器)

确保备份所有重要数据。


磁盘问题几乎总是随着时间的推移而恶化,说明中并非如此。
Flotsam N. Jetsam 2010年

@Flotsam好点。几年后,片状硬盘驱动器可能会失效。那么也许是片状的RAID控制器。事件日志仍然可以提供一些很好的提示。
詹姆斯·T

不是很糟糕的建议,但不是针对该配置和所描述症状的当场。
ЯрославРахматуллин
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.