在内部生产服务器上安排定期更新的最佳时间是什么?


9

给定一个以生产模式运行的内部服务器,我希望在部署常规更新时(对服务器本身,而不是对用户计算机,..但将是一个非常类似的问题),将对用户的影响保持在尽可能低的水平。

我的问题的明显答案是“晚上,当用户在家时”。但是“夜晚”是很长的时间。是否应该在傍晚开始,以便尽早发现更新问题并准备回滚?还是更早开始使用第一批用户作为“豚鼠”来更快地触发问题,这更好吗?还是在半夜里,负责监督更新的人员的集中度很低,但是可以保证某些较晚工作的用户没有打开的文件句柄?

是否有关于该主题的研究论文?

Answers:


5

为什么不从历史上查看系统的并发使用率并确定一天中的最低使用率?然后在您的低使用期中间保留您的更改。

确定变更需要多长时间时,包括实施前/实施后测试和生产验证测试。此外,计算出如果任何测试失败,更改将回退多长时间。

恕我直言,您的“第一用户”不应该是豚鼠。让实时用户基本上进行生产验证来测试您的更改不是一件好事。它破坏了最终用户的信心,意外的结果会破坏生产,这不仅意味着您必须回滚更改,而且还回滚更改可能引起的任何“损害”。

我不了解任何研究论文,但是看看任何IT服务管理框架(ITSM)(例如ITIL),您会发现许多有关软件版本管理的标准和最佳实践。所有系统都是不同的,因此您采用多少种实践的程度以及形式都取决于。ITSM标准考虑了大型系统。


标准和最佳实践并非一帆风顺,这就是为什么我对“原始”研究感兴趣的原因。但还是要谢谢
akira 2010年

是的,我知道标准并非一无所成。说明我对该地区研究论文的无知。
尼克·卡瓦迪亚斯

5

这完全取决于业务的性质。有些办公室每周5天9-5。其他业务是一年365天,一天24小时不间断。人员和资源可用性等其他因素也起着重要作用。没有任何研究论文能够全面涵盖所有可能的时间表或偶然事件。

最终,公司或部门的管理层必须与IT管理部门共同确定最佳方案。

成功的关键是在预定的停机时间开始,与预期的持续时间,用户需要的任何准备以及他们对成功或失败的期望方面与用户进行沟通。其中很大一部分是达到您设定的期望。

最后,什么都没有刻在石头上。如果该过程不起作用,请进行调整。您的灵活性和适应性将不​​胜感激。

通过在可能的情况下预先对测试设备执行维护和更新程序,可以在准备将其在生产系统上实施时为您做好准备。


williamson:研究:可以衡量有多少总管理员在一天中的哪个时间进行更新,以及他们在早晨或晚上是否遇到了更多错误。即使某个管理员必须在特定时间采取某种行动来适应公司的情况:如果研究表明他处于“错误”时区,那么他也许可以做出一些改变。我很好奇人们何时真正进行更新,前2个答案选择了准确的“晚上”和“早上” :)
akira 2010年

1
从协商的中断窗口的开头开始。这使您有最大的时间来修复出现问题的地方。
mfinni 2010年

公平地说,这是我们通常忘记提及的“大多数是常识”的东西。
mfinni 2010年

3

我在ISP工作,根据我的经验,我认为大多数人都是沉重的系统管理员,他们选择在假日周末的星期五晚上进行主要的网络检修。这给了他们额外的24小时测试时间,并在必要时回滚他们的更改。但是,在很大程度上,这完全取决于用户的性质和习惯。


1
当我在大学工作时,我们也做过同样的事情-假期也意味着人们相处的可能性较小,但是根据业务类型的不同,这可能会产生相反的效果。
Joe H.

是的,但这里我的目标是“每日”更新。如果空闲窗口是48小时..则这确实是显而易见的选择。
akira 2010年

@akira:他们的右脑中没有人每天更新
Zypher 2010年

2

我们在晚上9点安装更新程序,大多数人都不会迟到,而必要时提早整夜睡。


2

就我而言,我们会在凌晨4点安装更新程序,以避免对任何用户产生影响,即使是工作稍晚的用户也是如此。

如果您有一个良好的监视系统,如果出现问题可以向您发出警告,则您应该能够在清晨甚至上班之前对其进行修复。


1

这确实取决于您的业务性质,但是我个人更喜欢在周三晚上5点以后。您永远不想在周五晚上这样做,因为如果出现问题,您将在周末工作。在星期三执行此操作将使您在星期四和星期五解决问题(如果有)。

另一个重要因素是安排变更管理窗口。让人们知道您正在运行维护非常重要-在此期间服务可能会中断或不可用。它使您可以放心地工作,而不必担心用户会抱怨服务已关闭。当然,您的管理层需要批准更改窗口。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.