在系统管理领域中是否存在任何众所周知的反模式?[关闭]


9

我知道一些常见的模式似乎在每个项目的生命周期的某个时刻都令人不快:

  1. 无法断电
  2. 第三方组件阻止升级
  3. 非统一环境
  4. 缺乏监控和警报
  5. 缺少冗余
  6. 容量不足
  7. 变更管理不善
  8. 过于宽松或严格的访问政策
  9. 组织变更不利地模糊了基础架构所有权

我希望可以在书本或网站中总结一些明确表达这些反模式的库。我几乎肯定地说,许多组织正在通过解雇方法来学习。如果没有,让我们开始一个。


那不是社区维基吗?

如您所愿....
ojblass

在当前的话题性规则下,这个问题是题外话。
HopelessN00b

Answers:


7

在手动执行任务之前,要让自动化任务自动化,这会占用无法自动化的时间,因为手动执行任务总是很麻烦。

相反,过早的自动化。绝对不需要花费3N个小时来自动执行一次需要N个小时才能手动完成的单发任务(即使自动化比手动处理更有趣)。


4

A.不测试还原-可以验证备份,可以,但是如何还原?

需要多长时间,需要什么时间?您必须知道在压力很大的情况下要这样做...

B.没有配置管理,没有统一性-只是到处更改,我想我已经在这里进行了一些调整...

如果没有写下所有怪癖并且商店中没有相同的配置,谁知道如何复制性能良好的服务器?如果您成功还原了数据,但未还原配置应用程序,该怎么办?

C.没有监控-不知道盒子的方式和作用

这有两个方面:a)您必须监视警报以在某些资源或奇怪行为用尽之前及时作出反应,并且b)您必须监视长期趋势以管理容量(磁盘,CPU,RAM,网络等)。 ..)。

D. CFG中没有冗余-XX死了会发生什么

这意味着您需要提前计划系统管理员的需求。

对我来说,这些是最重要的。


但愿如此。特别是B和C。但是D是可选的-您不能总是有冗余,因为这是成本/收益的问题。
指挥官肯恩

我们已经开始使用Puppet来解决B问题,我对此建议不多。完成后,我们应该可以将几乎所有服务器重建到不到一个小时的状态。如果您没有C,那么您实际上是盲目的。如果没有警报,您将不知道什么是行不通的,并且如果没有图表,您将无法判断未来会发生什么,也无法知道现在正在发生什么。
David Pashley 2009年

4

最致命的模式是系统管理部门(或整个IT)成为公司的被动参与者。也就是说,它们被视为一种自助服务,每个人都已经有了已经形成的想法,应该如何做,这仅考虑了用户需求,而不是整个IT生态系统的整体需求。

第二大杀手模式是当系统管理部门变成一堆按钮时,即,第三方购买或开发并安装了所有软件/工具,并且系统管理人员接受了官方培训和手册,然后仅遵循操作手册和将手册中未明确列出的所有内容上报给供应商。这种情况对(即使不是大多数)系统管理员来说可能非常舒适,但这是一场灾难,等待着人们去做,因为事实上没人真正知道整个系统的实际工作原理会把它付诸实践(想想组件之间的微妙交互)。供应商之间的责备游戏)。


您的第二点很正确。通常,这是技术人员无法控制的。管理层希望技术人员每天进行无聊的工作,而一些第三方则来做解释实施工作。这样,组织内的任何人都无法支持t =局外人已安装的所有内容。然后技术人员离开,因为他们刚刚成为了荣耀的帮助台人员。经理人不能忍受'em,不能没有'em而获得报酬。:/
Jason Tan

2

1)承诺过高而交付不足(即保持用户期望切合实际)

2)直到需要时才验证备份。

编辑:我打算编号2包括文件/数据的恢复


我养成了不尝试承诺任何事情的习惯:)
David Pashley 2009年

不承诺任何东西都会使用户发疯,管理也是如此。学习诺言,以及在情况变化无价的情况下如何重新设定期望。
克里斯S 2010年

0

不监视AD帐户使用模式,例如上次登录时间> 30天

(出于审核原因,我们必须这样做,但结果令人震惊)


0
  • 将关键信息保存在一个人的头/收件箱/文件文件夹中。如果它很重要,例如供应商的联系方式,许可证密钥,设置说明,则它必须对拥有权限并可能需要访问它的部门中的每个人都可用,并且必须位于标准位置。

  • 询问知道某事的人来记录它。这听起来不错,因为他们是拥有知识的人,但实际上不好,因为他们无法轻易分辨出重要的知识是什么。最好让某人有新的处理方法,向知识渊博的人询问他们需要的任何信息,并在他们这样做时进行记录。

  • 不清楚的文档。任何人都可以在白天与整个IT部门进行对话来解决中优先级问题。到深夜,当您几乎独自一人并且不知道为什么设置系统的状态或为何与文档中所述内容不匹配时,解决高优先级问题是另一回事。

  • 密码跟踪不正确。因此,您很快就需要一个帐户,使用一个随机密码创建一个帐户,然后在18个月后仍在使用该帐户,并且没人知道该密码,或者如果更改该密码,服务将中断。

  • 不购买供应商对关键系统的支持,因为它“太贵了”。

  • 优先事项不当。IT人员应以管理层为指导-达成协议,确定哪些项目是优先事项,或者在紧急情况下应首先建立哪些系统。如果IT部门试图修复业务系统,则管理部门要求发送电子邮件,而用户则要求进行订单处理,这是一团糟。

  • 不适当的解决方案-IT部门很容易陷入“要修复它,IT系统必须按照以前的样子工作”的思想,这时更适合拥有管理IT协议来“尝试2小时,如果它不是固定的,那么即使看起来很有希望,也要停止,然后再从备份中恢复。”

  • 到处都有测试文件的副本。您不想打开一个运行业务系统或网站的文件夹,并看到“网站新/,网站当前/,网站复制/,网站测试/,网站测试-dave /,网站使用- this-one /,feel-from-feb /等),开发,生产和测试应该存在,并且应该与涉及的每个部门(IT,开发,项目管理等)分开,知道应该在哪里,并就如何进行更改达成共识被批准,也用于配置文件。

  • 更改批准-即使您只是先进行口头讨论,也不要在其他人不知情的情况下更改重要内容的工作方式。由您决定哪种“重要”内容适合您的情况。

  • 长期存在的呆板解决方案。我知道您很快就用旧电话线将此服务器修补到了该网络上,从而可以解决紧急问题。我知道您没有时间适当地重做。抽出时间。

  • 与公司其他部门关系不良。IT是一项服务,可以帮助公司的其他成员完成工作。如果他们需要快速的大型文件,那就去实现它。如果您需要管理许可才能购买硬件,请购买它。如果无法理解,请明确传达大文件无法快速移动的原因,因为管理层已将其他支出列为优先事项。如果出于法律原因需要归档但没有预算,则需要尽可能使归档适合您的系统。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.