笔记本电脑的温度比正常情况高30°C;据报道CPU /负载正常。是什么原因引起的,如何诊断?


10

我正在ThinkPad t420笔记本电脑上运行最新的Arch Linux,并且遇到间歇性散热问题,我的温度将从典型的〜45°C升高到〜75-90°C,并保持在那里直到我重新启动。

我已经运行几个诊断工具,包括明显的htop和其他人的谷歌搜索曾建议,其中包括powertopiostats和别人肯定我不记得。到目前为止,无论我的机器是正常运行还是处于高温状态,我都没有发现明显的问题,而且表面上看没有任何差异。

我还一一杀死了大多数可疑进程(数据库和其他守护程序),希望找到隐藏的罪魁祸首,但无济于事。

除了这些尝试,我不知道从哪里开始进行故障排除。我希望有人可以指出正确的方向,开始寻找更深层次的问题。

准确地说,我的问题不是如何冷却机器,而是什么会导致(据报道)CPU和负载正常的系统中出现持续30度以上的热量变化?我可以使用哪些工具/方法进行诊断?

一些说明可能会有所帮助:

  • 可以冷却系统(例如,完全脱离风扇控制),但是如果不理会它会立即再次变热。这似乎表明保温不是问题,而是某种东西不断产生热量。
  • htop进入此热状态后,按正常报告CPU使用率和负载。这包括内核线程。根据htop,系统实际上是空闲的(系统范围内CPU使用率为1-2%,负载为0.10)。
  • 我的机器使用Intel HD集成显卡,并且没有其他显卡。如@braiam所指出的,该型号可以选择使用nVidia卡。我没有选择它。
  • @terdon调出了CPU调速器设置。我的CPU设置为powersave
  • 我的特定处理器是2.7GHz Core i7-2620M。

编辑:在撰写此问题时,我的风扇控制无法正常运行,并且即使在高温下也以中等RPM范围(3900 RPM)连续运行。在@Alex和@JustDanyul的建议下,此问题已修复。但是,潜在的问题仍然存在。


1
就像slm所暗示的那样,如果CPU处于空闲状态但内核温度过高,则唯一可能的解释是在某些事件发生后不会散发过多的热量-唯一会产生大量热量的就是CPU。考虑将炉灶完全烧开,烧开水,然后盖上锅盖,然后将锅盖调低到最低水平:水永远保持沸腾状态,因为只要锅盖盖住,热量就不能像低端炉头一样迅速散发开启。将其拆开并清洁,如果情况很糟,此时吹气可能无济于事。
goldilocks 2013年

我肯定会拆开并清洁它,因为我确实怀疑我遇到了一些空气流通问题,但是由于是在导致极端温度变化的事件发生之后,CPU才会无限期保持恒定的高温。即使您将锅盖留在锅上,水温也会在某些时候下降。我的温度达到一个数字,然后一直停留在那个数字上,直到我重新启动为止。没有逐步的热量累积表明它存在散热问题。我整个上午一直在满负荷工作,现在正坐在41度。
13年

换句话说,我的温度通常会在预期压力下自我调节。如果我进行一些困难的编译,它可能会加热到60、70度,但是完成后它会冷却下来。
13

除风扇外,您可能还需要重新涂抹导热膏。便宜的导热膏会随着时间消散。
BlueRaja-Danny Pflughoeft13年

1
也许这是一个愚蠢的问题,但是您是否偶然禁用了ACPI?前段时间,我在使用一台旧PC时遇到了类似的问题,该PC不能在启用此选项的情况下启动,在禁用它之后,它最终会启动,但也过热。
Alko 2013年

Answers:


6

风扇

我的也这样做,运行Fedora14。尝试获取压缩的空气罐,并吹出机箱背面和侧面的通风孔。

此外,还需要定期卸下键盘,并将压缩空气直接吹到风扇的叶片上。他们沾上灰尘,并通过降低重量开始发挥效果。

Thinkpad最好的是服务手册!他们向您展示如何拆卸笔记本电脑并将其放回原处。

不好的过程

我注意到的另一件事是,我偶尔会遇到一个错误的流程,该流程将消耗其中一个内核的100%。杀死这个过程通常会使温度恢复正常。

您可以使用htoptop查看它是什么过程,然后从或从使用它的终端中将其杀死PID

还有什么?

请参阅我对此U&L问答的回答,以获取有关如何获取笔记本电脑各个组件的温度读数的更多提示。问答题为:如何在i3status中获取haswell i7内核的内核温度


这绝对是我应该做的事情,但是对我来说奇怪的是,为什么它有时仅进入热状态并一直持续到重新启动,这立即解决了该问题。似乎必须发生某些事情,从而触发热量的持续变化。我没有运行htop。CPU使用率正常。
Numbers1311407 2013年

也许内核有一些唤醒信号?
Braiam 2013年

1
@slm谢谢,我还没有尝试过。下次启动时,我将这样做并报告结果。
Numbers1311407

1
@ numbers1311407:重启可能很快解决问题的原因可能是这会关闭CPU几秒钟,从而使温度降至临界点以下。无论“环境”如何,CPU 始终比环境温度更高。
goldilocks 2013年

1
请注意,在top命令中,您可以按“ 1”以查看各个内核的负载。
克里斯汀·斯图尔特

3

这只是一个很长的评论,但您应该查看一下thinkwiki.org,它是ThinkPads上Linux 资源。至于温度,我的t4500也有类似的问题,并通过与

  1. 控制CPU频率缩放的CPU调速器。您的选择是:

    • 性能使CPU保持尽可能高的频率
    • 省电功能使CPU保持最低频率
    • 用户空间(通过/ sys文件系统)将可用的频率信息导出到用户级别,并允许用户空间控制CPU频率
    • Ondemand根据CPU使用率来缩放CPU频率(就像用户空间频率缩放守护程序一样,但在内核中)
    • 保守行为像按需行为,但逐步增加频率

    使用ondemand时,您的CPU将仅在必要时以最高速度运行。理想情况下,这对您来说是完全透明的,您的计算机将简单地以当前任务所需的速度运行。要激活它

    sudo echo ondemand > /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
    
  2. 风扇控制。有一个非常好的工具,叫做“ Simple ThinkPad Fan Control ”,它可以让您微调触发温度,从而改变风扇的速度。也可以通过这里查看信息。


谢谢,这非常有帮助。我以前偶然发现过该Wiki,但从未真正注意到它的确切含义。
13

请注意,我所有的CPU都在运行powersave
1313407

1

我认为您认为“热门”存在问题。对于Thinkpad t420(根据论坛),其温度约为80-85摄氏度,请不要忘记可能会引起温度升高的nVidia卡(实际上Optimus配置可能无法很好地工作,从而迫使您的CPU执行GPU工作)。也就是说,您的CPU最高容许温度为100C(如果达到该温度,系统将关闭),而环境温度约为10.0°C至35.0°C。就是说,如果您的笔记本电脑在此范围内,则一切正常(电池和笔记本电脑的使用寿命除外)。

现在您想指出可能的嫌疑犯。在这方面,我要说的是,nVidia在Linux上实施不佳可能会给您的CPU带来麻烦,因为它们臭名昭著的按需系统Optimus似乎无法在htop(或任何地方)显示,这似乎适合您当前的困境(它可以正常工作直到片刻,然后开始加热而不受控制)。您应该更新安装,直到您对Bumblebee进行了完全配置。您可以随意使用bbswitch来禁用nVidia卡并查看其运行情况。

要安装Bumblebee for Arch,您可以在存储库中找到该软件包。如果您尚未安装。


我没有在这台机器上选择nVidia卡。抱歉,应该在问题上更清楚了。虽然80-85 不太热,但仍然比40年代中期还要热,这是我的计算机通常在典型的轻负载下运行的温度。我的问题是尝试确定什么幻像条件“开始”,并使我的一致45变为一致80-85。
13

1

传感器显示我的风扇以〜3900 RPM的速度嗡嗡作响

即使在大约75-90°C的温度下?

因为手动启动风扇会暂时冷却机器

那么一个问题就是风扇速度不能自动运行吗?

不用担心自动运行,您可以正确读取温度,并且可以手动控制风扇速度,对吗?如果是这样,您所需要做的就是找到一个有效的风扇控制脚本或自己动手(根据表格轮询温度并设置速度temp[i]=speed[i],当设置更高的速度时,即使温度下降,也请保持一段时间) ,当您需要降低速度时,请慢慢进行并逐步进行操作)。

关于民意测验,最好的办法是有一个温度监视器守护程序来触发热变化事件,并让风扇控制脚本监听/等待这些事件,acpid但现在(也许是错误的),但是现在我还不知道。

在两种情况下(您自己/现有的脚本),尽管您对解决方案都不确定,请始终关注温度和RPM,但风扇不得停止运转。

首先解决此auto问题,如果过热仍然存在,则可以集中解决原因。

编辑

您可能想尝试使用类似的工具lttng来收集整个系统的统计信息,但是如果您需要长时间收集,可能不容易设置,并且在存储方面可能会很昂贵。


没错,我的风扇控制效果不佳(如果有的话)。我将研究使其正确响应,但是修复它并不能解决根本原因。我可以整天以最大6400ish rpm的速度放开东西,然后冷却一下,但这是我要解决的原因。
13

1

由于手动增加风扇的转速可以解决问题,因此这是开始进行故障排除的好地方,因为这似乎表明自动风扇控制无法正常工作。

现在,您运行arch linux,这是一个了不起的发行版(是的,我也运行了它),其中包含一个了不起的Wiki。所以,我不得不问,您是RTFM吗?; p

https://wiki.archlinux.org/index.php/Lenovo_ThinkPad_T420#Fans

据我所知,您需要:

  1. 启用thinkpad_acpi内核模块
  2. 从AUR安装和配置thinkfan应用程序
  3. 启用thinkfan系统服务

这一切都完成了吗?

更新 我很高兴听到您的粉丝现在可以正常工作,而不仅仅是在愉快的环境中旋转。(我认为这解决了您的机器在80度以上的温度下运行的问题?)

关于回答30度温度变化的根本原因,我很想问:那不是因为您的风扇工作不正常吗?

让我们假设

  • 处理器工作不正常
  • 现在将温度波动替换为风扇速度波动

假设根本没有问题,只是因为您的风扇运行在勉强可以应对的水平上,这不是安全的假设吗?而且环境温度等的微小变化是否超出了其功能极限?

例如,我有一台Acer笔记本电脑,在温暖的日子里,风扇“不断地”上下旋转。我敢打赌,如果我的风扇无法自行进行自我调节,我也会看到相当大的温度波动:)


我刚刚安装了thinkfan。感谢您的注意。是的,详细的Arch Wiki是该发行版的一项不错的功能。我去过那里一千次,但我从未偶然发现或想到要寻找专门针对我的确切模型的页面,也从未见过thinkfan被提及。不错的小脚本。 话虽如此,这并不能解决我的实际问题:如何诊断我异常高温的原因? 即使我脱离了风扇控制并以最大RPM的速度切开了东西,但这也只是对神秘热量的真实问题施加了创可贴。
number1311407

不,问题仍然存在。我现在正坐在这里42度 当我出现高温时,我将运行相同的过程,环境将是相同的,表面上什么都不会改变,但是我的温度将从稳定的42升高到稳定的75+。我可以冷却一下:将其放在笔记本电脑的散热器上,松开风扇控件,以6500 RPM的转速旋转,等等。但是如果我停下来,它将立即加热到75+。风扇的最大速度仅比其正常运转快一点。修复它是一件好事,但不是解决根本问题的方法。
数字1311407
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.