一个CPU持续24/7运行多长时间[重复]


17

我有一台Ryzen 1700X(在启动时得到它),在我的主Linux机器上运行,其他组件也与之相当。在计算机开机且不使用的白天,我喜欢在计算机上运行BOINC客户端,该客户端将Ryzen的所有16个线程最大化到100%,而没有一个回退,并且可以将其维持数小时。我的问题是,如果我要像这样运行计算机,而忽略电费和PSU的故障(尚未出现,我的1050w 80金币运行非常平稳),我能期待CPU多长时间?在严重损坏有机硅之前先进行操作。我并没有夸大其词,甚至没有达到“ AMD保证+ 400M Hz(Ryzen上的OC似乎不稳定),并且它是通过Corsair Hydro H60冷却的,这是可以接受的,


8
年龄要大得多,所以我只是在评论而不是回答,但是我叔叔的实验室里有286颗,这是在80年代中期购买的,用来进行长期实验。从那时起,它一直在控制着上述实验(他是地质学家,几乎没有进展),并且没有任何失败的迹象。
约瑟夫·罗杰斯

1
@JosephRogers什么样的实验需要不断监测30年?
user137

8
@ user137 音高下降实验,例如;-)
flolilo

2
硅树脂受到严重损坏常见错误;-)硅e是某些植入物,套件等中使用的(no e)是用于制造芯片的金属。
Bimpelrekkie

2
@WannabeCoder是我的猜测,基于POST产生PEI错误代码0x54,“未指定的内存初始化错误”的事实。内存正常(在另一个系统中测试过),主板(在另一个CPU中测试过)也一样,并且CPU在另一个系统中产生相同的错误代码。
史蒂芬·基特

Answers:


18

CPU本身可能会持续数十年。

系统可靠性的问题实际上是系统中的所有其他组件。随着负载变化以及打开和关闭系统,CPU将经历加热和冷却循环。机器中几乎每个组件的情况都一样。CPU硅片通过微小的电线连接到CPU的焊盘或引脚上,这会受影响。

硬盘驱动器将上下旋转,从而在驱动器电源控制器预热和冷却时在电机上产生机械应力,并产生热应力。

处理器中硅片的损坏不太可能是您会看到的任何一种故障模式,电压低且路径设计合理。仅在NAND闪存设备中,由于硅绝缘击穿可能会导致故障,但这是因为有意驱动它们导致非灾难性故障(但最终是灾难性的)。

与实际的CPU芯片内部的任何故障相比,当温度变化和组件移动非常轻微时,您更有可能看到由于热或机械应力引起的问题。


2
由于他以100%的负载运行,因此热膨胀对他来说不是一个大问题。
PlasmaHH

@PlasmaHH虽然CPU可能以100%的速度运行,但其他组件却可能没有运行。硬盘或其他设备上可能只有很少或间歇的负载。我确实提到过CPU可能会持续很长时间,但是它试图解决一个事实,那就是它实际上可能很快就会死掉。
Mokubai

22

普通使用的CPU故障很少见。制造商通常会提供默认的“不会失败”数字100,000小时,即刚刚超过十年。但最有可能的是,它将继续有效,直到技术过时为止。


12

热故障是我亲自看到的CPU(与支持设备相对)的唯一模式。我上次看到(或听说过)这种情况的原因是一台旧的Pentium III笔记本电脑在一个早晨起火了。

热管理现在是系统中更为复杂的操作,因此不允许CPU运行过热。通常,如果需要,CPU会节流时钟以降低温度,如果检测到温度过高,则整个系统都可以关闭。

因此,我认为对于现代CPU故障(过时之前)不是一个真正的问题。

主板故障似乎比CPU故障更常见(但仍然很少见)。驱动器故障通常是灰尘,特别是在重型服务器设置中。我不会再考虑CPU了。


笔记本电脑着火了?那东西里面积聚了多少灰尘,以便CPU的热量散发出来?这是Intel CPU的常见现象吗?担心5岁以上的Acer笔记本电脑
MoonRunestar

1
我一直都在使用那个特定的系统(非常)热点-我认为是设计缺陷。我不认为起火是灰尘,而是过热的材料释放出的气体或蒸气。这是十五年前左右。我完全不用担心现代笔记本电脑。英特尔和AMD分别在2005年和2003年推出了速度调节技术,并且笔记本电脑的散热设计已经进步了很多。
StephenG

3

CPU通常会因过热或某些电源(行程)问题而发生故障。我观察到CPU运行多年的唯一问题是,散热器将充满灰尘和堵塞。并且无法正确冷却。只要您将散热器保持在适当的工作条件下,CPU就可以了。


2
或某些功率(行程)问题的确,作为一名电子工程师,我认为PSU是更重要的故障点(与CPU相比),因为PSU中的组件通常比CPU和主板承受更大的压力。如果不在无尘的环境中,也要完全同意常规清洁。
Bimpelrekkie

3

在组装和销售工业PC的14年中,我已经看到一两个CPU的死机(售出的成千上万个)。但是,CPU周围的一切可能都是不同的故事。

散热通常是计算机制造商经常作弊的部分-很难说出计划过时的过失。由于CPU与散热器的热耦合很松散(特别是在无源/无风扇计算机中),不是CPU死了,而是CPU 周围的东西。VRM洗脱液曾经很经典,然后到了一段时间,它们就不再发行了(当每个铝润湿的洗脱液被可比的固态胶所替代时),然后电路板/计算机制造商开始压制并减少了固态胶的数量-VRM中的多晶电容器,或者使VRM成为全陶瓷但运行极热的电容器,或诸如此类...现代陶瓷电容器(MLCC)不再是永生的,而且MLCC寿命对工作电压和温度依赖性沿2或3次方上升(有人说甚至更高)。另一个经验法则是,温度每降低10°C,寿命就会增加一倍。

BGA封装与无铅焊接相结合-这是一个痛苦,特别是在BGA封装的芯片运行温度很高(散热器很小或足够大,但未正确热耦合到芯片)并且温度不断升高和降低的应用中。

我古老的DIY / HAM感觉似乎仍然是有效的:如果您可以将手指放在上面,并且它没有气味,则有一定的机会。我喜欢散热器不冷不热的设计(而且我知道内部的热源(通常是CPU)是热耦合良好的)。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.