您如何跟踪和记录日常维护?


10

你们针对服务器故障使用了哪些软件或系统来提醒您进行日常维护?您如何检查清单并记录应该检查的各种项目?您有内部流程文件吗?您是否每周都有cron邮件提醒您检查系统日志?

另外,您是否在团队中进行系统维护,如果是,您如何协调谁来进行维护?

如果您使用错误/问题跟踪系统输入任务,是否有cron作业输入重复任务?

Answers:


5

我目前正在使用Request Tracker(http://www.bestpractical.com/rt
所有维护事件都在“系统”队列中获得关联的票证。有关遇到的问题,谁在什么时候做的工作等的注释以及必要的批准均被记录在票证中。

目前,我们的重复任务(季度修补等)是手动创建的,但可以很容易地将它们自动化(定时作业+电子邮件)。

协调谁在做什么工作对我们来说相对容易,因为我们的管理小组中只有2个人,但是随着我们扩大规模,计划是为维护活动创建主票证,并使用分配给负责方的子票证委派工作。


日常工作(日志检查等)是另一回事:我已经将所有这些工作都提供给自动化流程了:

  • InterMapper监视服务器的整体状态(SNMP查询以查找高负载,磁盘空间不足等),Web界面的功能以及其他可能指示故障的事项。
  • Syslog-NG从我们的主机收集日志,并通过一堆脚本检查日志是否存在缺陷。我偶尔会注意日志以检查脚本,但它不是定期进行的。


2

正确实施的自动化完全消除了对任务和检查清单的需求。当您拥有可以更有效,更高效地完成工作的计算机时,为什么要手动检查事物?

监视系统会检查任何需要定期检查的内容。只要可行,例行任务便会自动执行,并为需要手动完成的少量任务发送提醒。文档是另一回事,但是只要做好,您的计算机就可以创建自己的文档。

不再寻找更好的手动方式,而开始寻找更好的自动化方式来完成任何工作。电脑在那里为我们工作,而不是我们为他们工作。


良好的经验法则:系统管理员应始终胜任并且懒惰。不工作的愿望将导致优秀的系统管理员实现良好的自动化。
voretaq10年

让我举一个具体的例子:我需要监视Apache的安全补丁,然后生成一个新版本并在补丁发布时对其进行测试。常规部分是监视新的Apache版本。无法直接从(主)存储库直接进行更新,因为它没有编译正确的模块。此外,还需要进行审核以确保已检查了发行版。这更有意义吗?
扎克2010年

另外,在构建通过质量检查之前,我不想发布任何最新软件。许多质量检查是自动化的,但不是全部。
扎克2010年

并且有一个原因不能全部用脚本编写吗?自动检查更新,在有可用更新时向您发送警报,然后编写脚本进行编译和安装,以供您测试。让机器完成大部分工作,并在需要注意时告诉您。
John

1

对于项目工作,它被从“项目管理”应用程序(集成了电子邮件和日历功能,可以记录详细的工作并将其安排给特定人员的功能)中淘汰。

对于维护,升级,修复等,我们有一个票务系统,该票务系统或多或少与我们的变更管理流程集成在一起,以处理请求和计划。

对于完全内部驱动的工作和长周期的工作(每季度,每年等):

提醒人们做好事。存在非正式/半正式文档(“ Wiki”),以了解一般时间表。

存在有关如何执行任务的大量“操作方法”和程序文档,并且整个团队都可以访问,但是人们有自己的管理员“黑皮书”以及带有注释和食谱的日志。


1

监视系统可以帮助解决以下问题:

  • 我们将每个月的维护工作记录在带有复选框的Word文档文件中。每个月,我们会将报告保存到NAS上的文件夹中。我们监视文件夹的最小文件期限。如果文件的最小使用期限超过40天,则会收到警报。

  • 我们日常维护的一部分是每月一次重新启动选定的服务器和设备。我们在监控软件上使用“系统正常运行时间”传感器(SNMP / WMI),如果正常运行时间超过40天,则会收到警报。

  • 对于备份,我们监视NAS上每台服务器的备份文件夹中的最小文件期限。如果文件的最短使用期限超过10天,则会收到警报。


1

我使用Checkpanel(https://checkpanel.com)管理我的定期维护任务。它提供了可重复使用的清单和易于记录每个检查结果的界面。

检查项目后,它不仅“完成”,而且仍可用于进一步检查。每张支票都被记录下来,以便您可以轻松地查看该项目过去所有支票的历史记录-包括可选的详细信息(例如,失败支票的错误消息)。

您可以为每个项目设置定期项目,以确保您每周/每2天等至少检查一次。所有到期项目都有统一的视图。如果您愿意,您还可以每天收到一封包含所有到期项目的电子邮件。

有一个服务器维护检查表模板,您可以将其用作自己的检查表的基础。其他模板包括用于Web应用程序,WordPress等的清单。

披露:我是Checkpanel的创始人。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.