这可能应该是社区Wiki。我试图列出所有我们应该定期执行的sysadmin任务,因为我认为我们在公司做得还不够。这里的态度是解决问题很不方便,但是我们没有时间进行预防性维护或持续改进。
日常:
- 交换每晚备份磁带/驱动器
- 检查防病毒更新是否已推送到所有系统
每周:
- 交换每周备份磁带/驱动器
- 从所有系统清除临时文件
- 对所有系统进行碎片整理
每月:
- 计划基础设施的改善
- 向电子回收商交付/发送过时的设备
- 重建或更换老化的工作站
- 测试从备份还原
年度:
- 重建或更换老化的服务器
- 更换UPS电池
这可能应该是社区Wiki。我试图列出所有我们应该定期执行的sysadmin任务,因为我认为我们在公司做得还不够。这里的态度是解决问题很不方便,但是我们没有时间进行预防性维护或持续改进。
日常:
每周:
每月:
年度:
Answers:
如果您没有足够的时间进行预防性维护并花费大量时间来解决问题,则需要对整个方法进行修改。与其告诉您每个时期应该做的事情,不如给我一些想法,这样您就不必做任何事情。
首先,您需要一个好的监控系统,以及您需要管理的尽可能多的自动化。这两个项目应该释放出比许多管理员更多的时间,直到他们设置好为止。
您的监视系统应该为您做的几件事是:
碎片整理甚至不应该出现在您的任务列表中,因为它应该是自动化的过程。以所需的时间间隔让服务器运行磁盘检查并在重新引导后进行碎片整理。考虑将其与系统绑定以安装排队的更新和补丁(之前已在非生产计算机上进行了测试)。
临时文件夹也可以自动清除。我创建了一个简单的应用程序,该应用程序在重启后等待10分钟,然后清除所有临时位置。延迟是为了确保它不会删除重启后完成的安装或升级所需的文件(这是很难学到的!)。
为了安全起见,您必须在适合自己的任何时间段手动执行的一件事是监视监视系统和自动化。我每天检查一次,但一年多来没有遇到任何问题。
当您完成系统和自动化的安装后,请确保还具有要安装的版本控制系统。发现最后的细微调整破坏了其他内容确实很烦人,但是您不记得确切的更改了。