我的电脑无法正常死机


59

我的计算机开始在不规则时间冻结了3周。

请注意,这个问题随我尝试的每件事改变。(有关更多详细信息)

怎么了

  • 我的电脑死机,视频停止。(没有图形故障,只是停止了)
  • 声音也停止了。
  • 有时,我的G-15键盘上的屏幕会随机闪烁,而我看到的字符不在正确的位置。通常发生大约1-2秒左右,然后计算机冻结。
  • 我必须按住电源按钮4秒钟才能关闭计算机。
  • 我仍然听到硬盘和风扇在工作。
  • 有时,它在一整天都没有问题,而有时,每次重新启动计算机时,它只会保持冻结状态,而我不得不将其留给一天的其余时间。
  • 有时,我的鼠标会非常随机地冻结几分之一秒(例如0.01到0.2秒),通常是在冻结之前。
  • 与我在该系统上的最后一个视频卡出现问题时(驱动程序错误),“操作中心”没有发现任何错误。
  • 我的G-15液晶屏也冻结了。
  • 有时,我的G-15液晶屏闪烁,并且人物在重负荷下被临时带走。
  • 现在,在大多数情况下,BIOS硬盘的启动顺序由于某种原因而被颠倒了,我必须将其置于正确的位置并在每次启动时保存。(可能不相关,不确定,但是它昨天才开始)

我到目前为止所做的

  • 过去我也遇到过类似的问题,并且更换了硬盘驱动器(这是有故障的),所以我测试了软件RAID-0阵列,但出现了故障,因此我进行了更改。(我在这一部分重新安装了Windows 7)。我还测试了拔下辅助硬盘驱动器的过程。
  • 我的CPU运行在大约100摄氏度,我清除了风扇和散热器之间的灰尘,现在温度在45-55之间。
  • 我进行了CPU压力测试,测试期间它没有冻结(Prime95在所有内核上使用)
  • 进行一次内存测试(使用memtest86+)一次,没有任何错误。
  • 使用ati-tools和运行GPU压力测试,并且furmark在测试过程中没有冻结。(也没有文物)
  • 我在购买图形卡时遇到了麻烦,但是我认为它已通过驱动程序更新得到解决。
  • 我检查了BIOS设置中的电压,它们看起来都还不错(我认为是±0.2)。
  • 我已经在计算机上运行了Fedora 15,而没有在外部硬盘驱动器上出现问题(除了无法加载Gnome 3并恢复为Gnome 2,不想安装驱动程序,因为我在多台计算机上使用了它)它可以将我的文件从RAID阵列备份到我的1TB硬盘驱动器中,以便重新安装Windows。(因此,崩溃仅发生在Windows上)[外部硬盘驱动器直接插在SATA端口上]
  • 我联系了EVGA(我的图形卡供应商),并向他们指出了这个问题,我在寻找答案。
  • sensors在Fedora 15和得到这个输出:http://pastebin.com/0BHJnAvu
  • 在Fedora 15上进行了6次简短的不同CPU压力测试(还没有找到用于Linux的完整压力测试器),并且没有崩溃。
  • 将导热膏更改为适用于我的CPU的Artic Silver 5,并对CPU进行压力测试,温度为50空闲,然后最高为64,然后在测试过程中缓慢降至62。
  • 用临时图形卡进行一些压力测试,一切正常。
  • 用我的原始图形卡运行Furmark压力测试,然后再次冻结。GPU的温度为74C,CPU的温度为58C,主板的温度为40C或45C(Dunno,来自SpeedFan)。
  • 同时运行Furmark压力测试和CPU压力测试,结果:http : //pastebin.com/2t6PLpdJ
  • 我大约2个小时以来一直在紧张地使用我的计算机,并且没有崩溃。我还禁用了AMD Cool'n'quietBIOS上的功能,以便为CPU提供更多常规电源。在Furmark没有C'n'q的情况下运行时,我的计算机没有冻结,但是Furmark在运行CPU压力测试时,我遇到了一个“驱动程序内核错误”,并且已经恢复(并且崩溃了)。最终,计算机在没有我陪伴的情况下冻结了,但这次我的屏幕刚刚进入睡眠状态,无法唤醒它。
  • 在nTune中使用稳定性测试仪后,我的计算机再次冻结(以与以前相同的方式)。我注意到Speedfan为我提供了-16.97V的-12V和-8.78V的-5V。
  • 我将G-15换成了另一个基本的USB键盘(HP),并且已经运行furmark了大约10分钟,并且每60秒运行一次CPU稳定性测试,持续30秒,而我的计算机还没有崩溃。
  • 在没有我的G-15的情况下进行了一些更长时间的测试,并且像通常一样冻结。
  • 卸下了nForce硬盘控制器。
  • NVIDIA nForce SATA控制器中端口0和端口1的已禁用命令队列(日志错误)
  • 使用的CPUID HwMonitor,以下是电压:http ://pastebin.com/dfM7p4jV
  • 更改了主板BIOS中的某些配置:禁用PEG Link Mode,更改AI TuningStandard,禁用了1394 Controller,禁用HD Audio,禁用JMicron RAID controller和禁用SATA Raid
  • “有点希望”,我的电脑在观看youtube视频时死机了,但是没有经过GPU和CPU连续10小时的测试。
  • 我将BIOS恢复为默认值,并且:Disabled PEG Link Mode,Disabled HD Audio,Disabled JMicron RAID Controler,Disabled Serial Port Address,Disabled Parallel Port Address和Disabled Onboard 1394 Controller
  • 我更改了750GB硬盘驱动器的SATA电缆,还更改了插入它们的插槽(1-> 2、2-> 3、3-> 4)。
  • 将我的图形卡的省电功能从“自适应”更改为“最大性能”。
  • 跑了ECGA OC扫描仪,没有冻结,也没有伪影
  • 我为我的G-15键盘和G-500鼠标安装了Logitech驱动程序,然后重新启动以冻结。
  • 我删除了G-15键盘和G-500鼠标的Logitech驱动程序,但它仍然冻结。
  • 更换完硬盘,图形卡和电源以外的所有设备之后,我的计算机运行正常,并且没有遇到任何问题(这与Windows的安装完全相同,而我的旧主板也有问题)。卸下主板后,我发现一些弯曲的电容器(2)可能是问题的根源。由于这显然是由这些电容器引起的主板问题,因此我将接受与该解决方案最相关的答案。

何时发生

  • 当我玩视频游戏时(大多数)
  • 当我玩Flash游戏时(第二多)
  • 当我查看桌面背景时(打开窗口时很少发生,但有时会发生)
  • 当我的图形卡和CPU受到压力时。
  • 有时当我的图形卡压力很大时。
  • 有时当我的CPU压力很大时。

眼镜

  • Windows 7 x64家庭高级版
  • 主板:M2N-SLI Deluxe
  • 图形卡:EVGA GTX 570(非oc之一)[从EVGA网站获得的nVidia驱动程序版本275.33]
  • 处理器:AMD Phenom 9950 x2 @ 2.6GHz
  • 内存:金士顿4x2GB双通道(基本存储棒)
  • 硬盘驱动器:在RAID-0 + 1TB(WD鱼子酱黑色)中为2x250GB(西方数字鱼子酱),我用750GB(WD鱼子酱黑色)替换了RAID阵列[是的,我从RAID配置中删除了阵列]
  • 750W电源
  • 没有超频。曾经
  • 像4-5周前一样发生了一些断电,但是问题并没有在此后立即开始。(我不在家,所以我的电脑关机了)
  • 最近24小时的事件日志(警告,错误和严重错误):http : //pastebin.com/Bvvk31T7

我要感谢所有参与的人,很高兴看到有这么多人愿意帮助别人。有很多很棒的答案可能会在将来帮助其他有类似问题的人(至少我希望如此)。

在这种情况下,如何成功查明当前的硬件问题?(如果是硬件问题)


35
附带说明:这肯定是我在这里很长时间内看到的记录最完整的“我有计算机问题”问题之一。
slhck 2011年

22
@slhck当我向免费提供我帮助的用户提出问题时,我总是尝试向他们提供他们在需要他们之前需要的所有信息。
maaudet 2011年

8
@Manhim:这是一种很棒的思考方式。而且,更多的人应该这样想。
Wuffers 2011年

@Manhim-我遇到了非常相似的事情-偶发的崩溃;测试了我所有的硬件;新硬盘+主板。我确定这无关紧要,但是偶然的机会:您是否已在事件日志中检查event ID 11 error。以我为例,我不断收到成千上万个这样的文件The driver detected a controller error on \Device\Ide\IdePort2.。(事实证明,我的CDROM有问题,导致某种荒谬的冲突。更换CDROM驱动器和SATA端口后,它可以立即解决问题。您提到了该操作中心,但不是原木。如果有帮助,那么有帮助!
罗斯,

1
花一些钱,然后把电脑送到商店检查
一下

Answers:


9

100摄氏度太热了!您的处理器可能已经受到损坏。但是为了乐观起见,我想再运行两次memtest86来确保它不是内存。您确定正确地检测到时间和速度吗?

您是否检查过主板上的电容器是否坏/浮肿?如果不是您的主板,那么您的PSU要么变坏了,要么不足以为您的硬件供电。听起来这很可能是我的原因。

使用CoreTemp来测量CPU温度,因为它是周围最准确的程序之一。不要使用ATI工具,因为它与Windows 7不兼容。请改用RivaTuner。


使用CoreTemp时,CPU#0(仅显示CPU)的空闲状态平均为50摄氏度。
maaudet 2011年

那是主板。感谢您指出。当我删除图形卡时,我发现了有关它们的信息,它们被隐藏在其下方。
maaudet

@ Manhim,@ Bigbio,怎么可能达到100度?那不是水的沸腾温度吗?
Pacerier 2015年

这就是OP报告的内容,请阅读上文。注意我的评论“太热了!”
Bigbio2002

@ Bigbio2002嗨,我一个月前才升级了我的RAM。两次发生冻结,我不得​​不强行关闭笔记本电脑。在RAM升级之后,它是否会在某个时间损坏处理器或RAM?我应该采取什么预防措施或预防措施?(当冻结所有端口时,它们应该无法正常工作,但RAM似乎要坏了)PS我与新RAM的旧RAM具有相同的规格
jasinth premkumar,

13

首先,+ 1是一个完整记录的问题。这使事情变得非常容易为我们提供帮助。

迄今为止,您已经完成了许多硬件测试,并且大多数都没有问题。但是,这仍然可能是CPU过热的问题(在那里,它很烂)。清洁灰尘时,在CPU和散热器之间是否看到导热膏?如果是这样,它是干了还是老了?我建议购买一小束北极银导热膏(7美元),并将其涂在CPU上。

如果那不是问题,那么我强烈建议您开始研究您的操作系统,如果有任何问题。您说您已经在运行Fedora?我建议刻录Linux LiveCD并从中启动。尝试将其用作操作系统,浏览和播放音乐/视频和其他东西。如果您在那儿没有死机,那意味着它是Windows问题还是HDD问题(看来您不是在实时环境中使用它)。我会(从LiveCD)运行磁盘检查以确保。如果一切顺利,我们可以安全地说出它的Windows。

在这种情况下,您需要确定其操作系统是否已损坏,或者是否已安装正在运行某种服务的产品,从而将计算机锁定。尝试使用Windows安全模式,并尝试使用它(我知道,糟糕的分辨率...非常抱歉)。如果几天之内没有冻结,我们可以将其缩小为Windows OS问题,在这种情况下,您需要查看备份或重新安装。

如果您要重新安装操作系统,请确保备份所有内容。

在此处输入图片说明

http://xkcd.com/612/

编辑:在LiveCD会话中运行时,打开一个终端并键入sensors。如果安装了该程序(仅Linux),它将为您提供有关电源电压,CPU温度,主板温度以及您需要了解的所有其他信息。在LiveCD会话中进行监视应该可以为您提供强大的指示,以指示这是硬件还是软件。

编辑2:基于您所说的关于通过eSATA在另一个HDD上运行Fedora且没有发生任何崩溃的说法,我不得不说这是软件问题,可能是驱动程序。如果您可以运行Fedora,可以说整整一个星期都没有崩溃,那肯定是Windows或过时/错误的驱动程序存在问题。您运行Fedora多久了?您是否尝试过看电影,玩游戏等?


我要去商店买些导热膏。我认为已经有一年没有更改它了,可以尝试一下。对于操作系统,当我将RAID阵列更改为单个硬盘驱动器时,我已经重新安装了它(我的重要内容是在一台服务器上的网络硬盘驱动器上)。
maaudet 2011年

我现在要检查传感器。我会将结果放在我的主要职位上。
maaudet 2011年

重新安装Windows后,是否从同一映像重新安装Windows /是否安装了相同类型的软件?如果您不这样做,是的,我们肯定有硬件问题。
n0pe 2011年

我是从原始Windows DVD安装的。另外,我在Fedora 15上没有名为传感器的软件包。而且,我也很确定这也是硬件问题,但是我需要知道如何确定要更换的东西,所以我不会开始更换所有东西。 :|
maaudet 2011年

我不认为它会与fedora一起提供。尝试通过Fedora中的软件包管理器进行安装,或获取源代码并进行构建。
n0pe 2011年

5

我首先想到的是您的电源可能坏了。玩游戏或观看youtube可能会使您的grfx卡投入使用,并增加功率消耗。还请注意那些CPU温度为100度...


关键是,在我开始游戏或玩游戏后,它绝不会立即发生,通常是在2到5分钟之后。
maaudet 2011年

1
@Manhim:这!勉强读了你的问题,我很肯定,这就是问题所在。我遇到了完全相同的情况,我在计算机中交换了所有东西,只是看到它是电源。它甚至开始影响我的房间,并进入黑屏,或者在很长一段时间内越来越短地重新启动。您的版本似乎只是一个小例子,但我建议您在更换其他成本更高的硬件之前先购买另一个电源。同样,power-drones可能已经开始了……
Tamara Wijsman

1
这并不一定要在游戏开始时就开始(就CPU / GPU组合而言,要求不高),但是可能在稍后计划运行的Windows中开始运行时才开始。CPU / GPU使用率的微小峰值将足以需求过多的电源,在这里它只会削减更高的电压输出...
Tamara Wijsman

@Tim Wijsman我目前正在运行Furmark和CPU稳定性测试,它似乎很稳定。我从来没有一起测试过,我经过几次测试(以防万一)后将与其他显卡一起尝试[此临时显卡只是Quadro 1500 VS GTX 570,功耗应该有所不同。
maaudet 2011年

1
@汤姆·维斯曼(Tom Wijsman)对不起,我不合时宜。我已经订购了另一个电源,我将可以对其进行测试。我应该在下周收到。
maaudet 2011年

3

我有一台Windows 7 x64 Ultimate笔记本电脑,该笔记本电脑遭受相同的随机崩溃。我已经注意到,当插入G15键盘时,它们大多发生在家里。当我使用笔记本电脑键盘时,我不记得会发生这些崩溃。

G15在USB插头上消耗大量功率。也许与它有关?


我不知道这是否足以使我的计算机死机,而且我认为如果是那样的话,那么主板的MESFET可能就出问题了。我开始看这个了。
maaudet 2011年

好吧,到目前为止,它似乎仍然有效,我仍然需要做更多测试,但这将是解决该问题的一种了不起的解决方案。另一方面,我非常喜欢我的G-15,而且问题是随机出现的,我已经进行了6个月的设置,其中5个都没有问题(图形卡交换)。
maaudet 2011年

我也喜欢我的G15。我也不想把它报废。因此,另一种解决方案是将键盘插入有源USB集线器中
Johan Buret

嗯,似乎是因为另一个USB键盘而崩溃了:| 因此,它至少可以将问题隔离到电源和主板等基于电源的设备上。
maaudet 2011年

3

在nTune中使用稳定性测试仪,我的计算机再次冻结(与以前相同)。我注意到Speedfan为我提供了-16.97V的-12V和-8.78V的-5V。

更换电源。这些电压远远超出规格,可能是造成问题的原因。

编辑:负轨今天很少使用。但是,如果系统没有负载,则HWMonitor温度对于温度传感器2而言过高。冷却系统,主板或电源可能存在问题。


是否可以使用备用软件检查这些值?
maaudet

我个人使用CPUID HWMonitor
bwDraco 2011年

@DragonLord这是结果:pastebin.com/dfM7p4jV
maaudet 2011年

不幸的是,没有任何关于负电压轨的数据。所有正电压轨均在ATX规范内(正轨为±5%,负轨为±10%,请参阅ATX规范的第22页)。但是,今天很少使用负轨,除非系统处于负载状态,否则温度传感器2似乎太高。
bwDraco 2011年

@DragonLorg系统此时处于空闲状态,并且来自冷启动。
maaudet 2011年

3

我会停下来

我必须按住电源按钮4秒钟才能关闭计算机。

我可以说这是电源问题。为避免再次搁置休息,请关闭电源,拔下屏幕和电源线,并按住电源按钮约15秒钟。

这将释放任何带有电荷的组件。

看看是否可以更换,也可以检查电容器是否有问题,因为这里为什么我的计算机无法启动?并更换它们。


为什么?4秒是关闭电源的标准时间,此选项在BIOS中设置。您是在告诉我您的计算机永远不会死机,也不需要按下电源按钮4秒钟来切换电源吗?还是通过前后插入电源线来做同样的事情?
Andrejs Cainikovs 2011年

抱歉,我不是很清楚,我要说的是:当计算机已经关闭时,拔下电源插头,然后按住电源按钮。我知道这可能没有感觉,但确实,我只是分享自己的经验。

现在我明白了。
Andrejs Cainikovs'7

所以基本上它最终会冻结,因为某处保持着一些电荷,我需要在每次启动前都需要释放组件才能使计算机正常工作吗?(我的意思是,这将根据主板上的电容器确定主板或电源问题)
maaudet 2011年

2

什么视频卡芯片组(品牌名称无关紧要)?我见过Radeon HD 4xxx和5xxx系列的这些问题,当它们进入和退出省电模式(即GPU时钟速度改变)时会反弹。全屏显示YouTube是触发问题的最可靠方法。

有一些技巧可以禁用PowerPlay(更改时钟速度),包括使用Catalyst Control Center创建超频配置文件,然后将所有时钟设置编辑为相同(不需要实际的超频,但是必须启用“超频”模式让您覆盖默认电源配置文件)。

节省电量的结果之一是,GPU压力测试不会触发问题,因为它们可使GPU保持繁忙并以其最快的时钟频率运行。

您提到过ati-tools,所以我认为这是最有可能的罪魁祸首。

我没有发现有关更新视频卡驱动程序的任何消息。最新的版本在这方面似乎要好得多(或者也许他们继续使用配置有较早版本的强大功能抵消配置文件)。无论如何,升级到最新的Catalyst驱动程序都是值得尝试的。


我的显卡是GTX570。我将尝试使用与该显卡相同的显卡,然后我会看到的。
maaudet 2011年

@Manhim:您应该将其添加到问题的“规格”部分,因为它可能很重要。
Ben Voigt

我确定我已经添加了它:到了,抱歉。
maaudet 2011年

我尝试了没有节电的情况,它似乎更加稳定。你知道会导致什么吗?图形卡本身?电源?主板?还是仅仅是驾驶员问题?
maaudet 2011年

@Manhim:更改电压和时钟频率总是会在过渡期间创建一个间隔,在该间隔中逻辑无法正常工作。该卡应在该间隔内被强制闲置,如果在过渡完成前尝试恢复计算,则这是GPU中的设计错误。同样,任何数量的因素都会影响该转变的确切持续时间(温度,电容器值的变化),在这种情况下,有时会安全地发生转变,有时会出错。
Ben Voigt

2

我遇到过同样的问题。为最坏的状况做准备,我将USB HDD插入到设备背面的USB端口之一中,以执行系统映像,此后,我再也没有发生死机的情况。

我还有其他USB设备,但它们已连接到集线器。我认为当没有USB设备直接连接到USB端口时,集线器就会出现连接问题。这是自运行Win 7 64以来我遇到的第二个此类问题。其他时候,这些令人讨厌的随机冻结仅在将Firewire紧凑型闪存卡读取器连接至设备正面的Firewire端口时发生。随机冻结有时在2-5分钟内,有时在两天后。两者都取决于连接到计算机的外部设备。设备管理器中没有错误-事件日志中没有错误。



1

确保您使用的是最新的memtest86 + vesrion。我的PC出现内存问题,并用memtest挖出了一些旧的恢复CD。它运行良好,有点慢,但没有发现错误。经过更多研究后,我几乎确定它是有记忆的,因此我下载了最新版本并将其刻录在工作的笔记本电脑上。它运行得更快,这次发现了内存错误。


我在运行测试的同一天下载了最新版本。
maaudet 2011年

1

我的计算机也出现死机问题,我很高兴能浏览该网站。这是迄今为止我见过的最详细的帖子!我已经经历了很多类似的步骤,例如物理清洁风扇和机箱,还下载了OCCT,Memtest和HW Monitor之类的软件。

解决我计算机上问题的原因是:将BIOS更新到最新版本。

之后,计算机像老虎一样顺畅运行。我希望这个建议对某些人可能有用。不过,在更新BIOS时请多加注意,因为除非您的计算机出现问题并且无法修复,否则我不建议您这样做。


0

我将添加一个一般性的答案,关于Windows冻结

要测试它是否确实冻结,请在Windows中查看时钟,它显示的是分钟而不是秒,因此请给它几分钟以确保时钟保持静止,因此您知道这不是键盘/鼠标问题。或者另一种测试可能是尝试再次将键盘/鼠标插入另一个插座。如果已经冻结并经过测试以确保冻结,则可以确定是冻结而不是键盘和鼠标问题。如果是键盘/鼠标,则不可能同时是键盘和鼠标,因此在断定这是冻结之前,请务必同时尝试两者。解决计算机死机可能会非常耗时,因此您要确保它死机了!

如果您遇到死机,要做的就是查看事件查看器以获取线索。

这是窗口的图片 http://2.bp.blogspot.com/-vTooTxWDEpk/U7wCYWKZm3I/AAAAAAAACRI/Zpwe2sT-hwc/s1600/uptime002-eventlogVista.jpg

在事件查看器中,您通常想扩展窗口日志并转到“系统”

查找红色的X,尤其是与崩溃同时发生的任何事件。

还要查看Windows日志..应用程序(在事件查看器中选择左侧的内容)..再次查找与崩溃同时发生的事件。

确保Windows设置为在发生崩溃时写入内存转储。不是很大的内存转储(不是完整的内存转储),但是“小”或“内核”的内核可能比小更好。但是,如果内核太大,则使用小。

有一个需要勾选的设置。 http://i.imgur.com/OvDZBT6.png 然后您会看到转储文件的路径。因此,只要设置好它,然后下次冻结​​,它就会生成一个转储文件。如果太大,可以拉一下拉链,然后再到这里。他们接受最多40MB的上传。 http://www.osronline.com/page.cfm?name=analyze 单击“选择文件”和“上传”按钮以上传它并查看结果。

另一件事是检查硬盘A)查看SMART数据B)运行硬盘驱动器制造商工具以检查硬盘。该软件通常很小,经常在Windows中运行(不需要制作可启动的cd / usb),并且通常具有用于快速测试的选项(不需要数小时)。

可以尝试的另一件事是测试RAM最简单的方法是如果您有多个,例如,您有两个RAM模块。因此,您使用一个RAM模块运行计算机,然后查看它是否冻结。然后尝试仅与其他RAM模块一起运行。这些插槽标有DIMM0 DIMM1 DIMM2,可通过手电筒或MBRD手册查看。因此,当您有一个RAM模块时,只需使用第一个插槽DIMM0。

另一种方法却很漫长,甚至没有意义,那就是将memtest86整夜运行10个小时左右,然后查看它是否显示任何错误。如果是这样,那么事情就不会告诉您whnci模块。因此,您必须在每个模块上再次运行它。而且,您必须为其制作可引导的CD或USB。

因此,对于RAM测试,更好的方法是比较简单的方法,即尝试使用一个模块运行comp,进行RAM测试,然后再运行另一个模块,而不是memtest86。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.