是否应在晚上关闭服务器?


144

从早上4:30到〜22:00,都使用一台服务器。

应该关闭吗?我认为这是一台服务器,并且不会有任何问题,但是认真的教授告诉我,这很危险,高清可能会在2年内失效。服务器所有者认为,他的旧服务器从1995年开始运行,没有备份,只有一个硬盘(如果硬盘发生故障,则需要拧紧),这没有问题,因为他曾经在晚上将其关闭。

您对此有何看法?

现在,它具有RAID 1阵列,外部硬盘备份以及DVD和Internet上的服务器级完整硬盘备份。


62
+1是因为即使这个问题我都不认为我们中的任何一个人都曾想到过,但显然有些人愿意并且需要得到回答。
Mark Henderson

8
您的教授不在运行服务器。他们正在运行带有网络守护程序的工作站。
培根

4
在不使用硬盘时,您是否可以使用某些电源设置来降低硬盘的速度?在磨损方面也有相同的好处,但是您不必关闭整个机器。
布伦丹·朗

34
教授英语点燃?
伊恩·霍尔德

28
我不建议从不进行备份的人员那里获得建议。如果他们这样做超过15年,尤其不会。节省电能是关闭电能的唯一理由。由于每天加热和冷却,使用寿命会减少。
马尔特

Answers:


153

将其比作汽车类比:的士可以在需要重建引擎之前完成500,000公里的路程。这样做的原因是,它们始终以24/7全天候运行,并且在汽车发动机达到温度后,它在运行时受到的磨损大大减少了。

电脑有点一样。服务器启动时,零件上的大多数“磨损”都可能发生。只需将安培表连接到计算机,然后将其打开即可。启动时,它消耗的功率会非常高,然后在所有磁盘都旋转起来并启动处理器后,它就会稳定下来。另外,请考虑服务器在启动期间和工作时所经历的磁盘活动量。引导操作系统进行磁盘访问的机会很可能是固定的,而当操作系统运行时,除非它是一个非常重的数据库服务器(我猜不是),否则磁盘很可能会保持相当空闲。如果有任何时间它会失败,则很有可能会启动。

打开和关闭服务器是一个愚蠢的主意。不仅要提到大多数服务器可能要花费2到5分钟以上的时间才能通过BIOS检查,这也浪费了大量时间。


2018年更新:鉴于大多数计算机现在基本上都是固态的,因此该答案可能不再像从前那样准确。出租车的类比并不完全适合当今的现代服务器。也就是说,通常您仍然通常不会关闭服务器。


15
您可以添加一些链接来研究此主题吗?
mafu 2011年

15
@mafutrct:维基于HD失败对HD失败谷歌实验室研究显示inconculsive证据表明电力周期影响硬盘寿命,和总运行时间确实不如抽签批/运气。同样明显的事情,例如身体创伤,也最有效。
克里斯S

3
如果出租车一直在运转,他们如何为出租车加油?在大多数司法管辖区这是非法的。
Lightness Races in Orbit

8
@Tomalak-好吧,比喻的要点是,出租车的发动机温度最高,在此期间磨损较少。在为出租车加油的90秒钟内,发动机没有机会冷却,因此磨损仍然减少。在计算机上,它立即被“冷却”(以此类推),并且每个启动都是一个“冷”启动。
Mark Henderson

6
@Fergus-好吧,这仅适用于物理盒子。如果有VM,可以随意打开/关闭它的电源。但是,您将无法获得任何挽救生命或节省电力的功能。
Mark Henderson

70

每天关闭服务器电源然后再打开,可能会比打开服务器更快地导致失败。


3
最有可能是由于启动时磁盘压力大。另外,我有一台服务器运行了好几年,然后拒绝重启服务器。事实证明,引导磁盘正在缓慢降级,而MBR完全不可读-但是MBR仅在引导时才读取,因此没有人注意到。幸运的是,只有在急于恢复尚未备份的内容之后,磁盘才完全消失。
Piskvor 2011年

我怀疑这种情况每天都会关闭一次,即使企业磁盘的技术细节也达到了300,000次打开。问题来自能源管理,能源管理每15分钟执行一次。
Lothar 2014年

我不明白一个答案只说明某人的想法,而又没有任何理由说过曾经收到过70次投票。
Bassie-c

52

我所看到的唯一与您被告知的情况非常接近的是,驱动器可能会在2年内发生故障。实际上,它们随时都可能失败。我确定我们大多数人至少已经收到了一个全新的驱动器,即DOA。平均而言,服务器驱动器可以持续使用大约3年以上的时间,而10或20年并不罕见。这并不意味着任何单个驱动器都不会很快出现故障。

服务器(意味着具有适当服务器级别组件的计算机)被设计为连续运行。没有必要在晚上关闭它,但是有一些非常好的理由让它继续运行。夜间或给定系统“安静”的其他时间是运行所有维护和自动化的时间。

例如,最好是在没有用户活动或用户活动很少的情况下进行备份。这有助于确保备份一致。当然有解决方法,但是如果这样做没有任何损失,为什么不给备份提供成功的一切机会呢?

运行带有单个磁盘且没有备份的“服务器”的人是傻瓜,而不是管理员。他逃脱的唯一原因是纯粹的愚蠢运气。它与晚上关闭机器绝对没有关系。


我在这里大胆猜测,说不进行备份的“管理员”也没有使用适当的服务器级组件。
直觉

23

服务器可以24x7全天候运行。整夜关闭服务器是非常不典型的。服务器硬盘驱动器的设计比台式机驱动器更可靠,并且现在有了备份和RAID 1,如果两个驱动器之一发生故障,则不会丢失数据。

对于这台拥有16年历史的服务器,我现在要担心的是主板或非冗余电源故障。


似乎合乎逻辑:)这是一个摩托罗拉PC电源PC ..还没有死!
GorillaApe 2011年

13

我从来没有在晚上关闭服务器。

硬盘将要发生故障时也会发生故障。打开和关闭计算机不会使驱动器故障变慢。我已经看到供应商提供的硬盘驱动器已经损坏,并且已经看到磁盘运行了5年以上(并且一直在被积极使用)而没有发生故障。

你的教授是白痴。


2
如果将驱动器关闭足够长的时间,则打开和关闭计算机肯定会使驱动器更缓慢地发生故障。如果关闭机器10年,则驱动器或多或少可以保证至少持续10年。问题是平均机器需要停顿多长时间才能产生积极的影响。
直觉

4
@intuited如果在等待了50年之后打开了计算机,但驱动器无法启动,它会持续0年,50年还是什么?
Cade Roux

@Cade Roux:我不知道。有什么关系?即使我们将其计算为0,该离群值也不会显着改变总体平均值。
直觉

1
@暗示这是个玩笑-但实际上,它可能会使平均research.google.com/archive/disk_failures.pdf偏离 。从这些数据来看,有可能在搁置5年后打开新驱动器。与运行5年的驱动器相比,发生故障的可能性更大。有一点很重要,因为它不会让硬件闲置多于关闭并重新打开它的回报。硬件会退化并且过时,需要在磨损和更换之前使用其最大值。
Cade Roux

@Cade Roux:从与Google链接的研究中可以发现:正如服务器级部署中常见的那样,磁盘已通电,旋转并在其记录的整个生命周期内都可以使用。 因此,此处的研究不相关。它的确表明,在重新启动后的一定时间内,新驱动器比旧驱动器更有可能发生故障,但这是假定旧驱动器在5年内没有发生故障的情况。运行。
直觉

11

这也给服务器带来了更大的“人性化”。即使您使用电源设置在正确的时间关闭和打开电源,也应该有人监视服务器以确保所有必需的服务等都能正确启动。 那是宝贵的时间,您可以教会教授有关备份和RAID的知识。

您什么时候运行备份?我会在6小时内提供一切来运行我的日常备份,更新,修补程序等。如果没有其他原因,则可以将停机时间用于此目的。

我向您提出挑战,请他们去找这些“认真的教授”,并提供研究表明,将计算机全天候24x7运行是不利的。我想备份他们的发言。


我说很认真,因为其中一个设计了处理器,嵌入式系统非常详细地了解linux内核。至于备份,我已经编写了用于自动备份的脚本,但是那里的所有者和管理员看起来像WTF花花公子。“不,我想每天手动进行操作”,不要“焦油压缩它们”。
GorillaApe 2011年

2
@Parhs简而言之,您比上司更聪明。在您花了太多时间在白痴的阴影下之前,您应该退出并找到一位真正的导师,这是明智的选择,因为白痴不会让您做正确的事。
天鹰

10

实际上,大多数服务器预计将提供24/7全天候可用。干净利落。

在您的机会不是这样的情况下,之间存在着很多争论,这之间的争论将导致服务器的磨损加剧,服务器开启与加热,然后关闭与冷却之间的不断膨胀和收缩。 ,或因长期使用而造成的零件磨损。

我还没有看到任何更糟糕的研究,而且我非常怀疑您的教授能否获得一些声称有所不同的研究。

最后,您必须根据自己的需求做出决定,但是对大多数企业而言,其成本优势在于,可以始终保持服务器和服务始终可用,而不仅仅是有人进入并开启服务。尤其是在有争论的情况下,实际上,关闭服务器可能会给服务器带来更多麻烦。


7

更重要的是冷却。冷却有很大的不同。盒子内部的温度可能比房间高得多。我会安装软件来像珠穆朗玛峰那样监视它。将现代硬盘与您更换的硬盘进行比较,它们运行很热。有些人需要风扇来冷却它们,有时候,小风扇可以起到很大作用。HD和服务器的寿命取决于散热效果。


5

是的,别无选择。告诉您的教授,行业标准是让他们保持24/7全天候运行,并对出现故障的硬件提供保修。如果服务器已使用16年,我想您将无法获得该保修。
如果服务器确实爆炸了,您将需要多少恢复时间来使用备份的信息构建新服务器?我会开始向客户暗示他们的服务器已经达到使用寿命,他们应该开始为新的服务器寻找资金。


5

的确,HDD很难承受电源循环的机械应力。此外,还有一些较旧的驱动器(当冷却到足够低时)由于“粘滞”而可能完全停止工作。

如果电路设计不当,打开机器时产生的浪涌电流也会给某些组件造成压力,尽管这种可能性不大。

就是说,有一个事实是,让机器继续运转会付出巨大的代价:电容器。主板上的众多电解电容器可能是系统可靠性的最薄弱环节。这些电容器具有额定电流/电压处理能力,工作温度和使用寿命。典型的电容器将被额定数千小时。重型/长寿命盖的额定使用寿命为数万小时,并且温度更高。

这就是为什么您有时会看到带有“服务器级电容器”的待售主板的原因-因为这些机器全天候24x7全天候运行,并且咀嚼了它们的主板寿命。


15年前,我听说过“磁盘统计”一词或类似的词,给出的解释是运行了多年的磁盘润滑剂中的聚合物开始形成长链,并且当磁盘断电并停止旋转轴承时抓住,将不会再次开始。DC中的电源故障通常意味着一堆服务器无法重启。当然,我不知道现在使用什么磁盘代替轴承。
jqa

+1表示严格。我想知道是否有人会提到它。@james,称为“限制”,已经做了很多工作来为驱动器提供润滑剂,这些润滑剂不会随着时间的推移而变稠,使用/滥用。情况比以前要好,但是打开和关闭驱动器仍然不是一个好主意,因为当电源中断时,它们很可能会死机,这可能是因为组件烧毁或驱动马达无法开始旋转盘片
格雷格,

从2008年(可能更早)开始生产的大多数母板现在都使用固态电容器,其寿命比电解电容器长得多。现在,电源是唯一仍然可以看到电解电容器的地方。
Mircea Chirea 2011年

那是固执(坚持+摩擦),而不是严格。:-)
kindall 2011年

2

当我让服务器从制造商那里获得每月的预防性维护时,他们开始时每个月都会关闭。这往往会导致组件故障。日程安排更改为每季度一次,然后仅在需要时更改为。除非有必要,否则我不建议您关闭一个旧的系统。


是的,我也看到服务器的正常运行时间超过1000天。但是不定期重新启动(热启动)是一种罪过。与计划外的系统重启相比,计划内的系统重启后遇到故障的系统更好。同样,这些重新引导往往会发现配置错误。
sjas

1

没有提到的一件事是,大多数服务器都有它们每天,每周或每月执行的维护任务。这些活动几乎总是安排在深夜,预计活动将在最低时进行。

例如,在Red Hat系统上,这些活动在服务器时间凌晨4:02开始。根据服务器的不同,它们可能会运行几秒钟到一个小时甚至更长的时间。如果您在4:30开启服务器,则这些维护任务将立即(通过anacron)启动,最早的用户在那之后到凌晨5点登录将受到一定程度的影响。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.