Answers:
监控+警报 -这是很大的安全网。就像开发人员编写单元测试以确保更新代码时不会弄乱事情一样,我依靠监视作为额外的安全网,以防万一我搞砸了某些事情(即断开服务器连接,拒绝防火墙上的生产流量等) 。它让您高枕无忧-如果出现问题,我会在客户致电之前通知您。
对我来说,它是集中式身份验证。
我要指出的是,我要管理40台左右的Slackware机器,每台机器都具有本地身份验证以及本地Samba身份验证。我也有一个VPN解决方案,其中需要设置每个帐户,以及一个内部jabber服务器和一个内部电子邮件服务器。一切都有自己的帐户。MAC(移动,添加,更改)非常疯狂。
因此,我从Slackware切换到CentOS,创建了Active Directory基础结构,并使用“类似开放”对我的所有Linux计算机进行了AD身份验证。大概一个月可以节省我20个小时,甚至一点也不开玩笑。
现在,我已经通过AD进行了所有身份验证,并且效果很好。如果您仍在以旧的方式行事,我不建议您使用集中式身份验证。
我同意这里显而易见的选择;自动化和中央身份验证。但是,看来我必须是提及document的人。
通过记录尽可能多的问题,工作流程,安装和指南,人们可以解决一些问题,而无需让我们的部门来处理。
另一个节省时间的好方法是问题跟踪。
能够确定任务的优先级,将其分配给团队成员,从而摆脱了通过电子邮件,msn或干脆到办公室来发送请求的所有混乱情况。这也有助于我们的好朋友,经理了解您的效率(如果需要)。
然后,当然,锦上添花的将是我的“ RTFM”(阅读精美手册)杯子,它得到了很大的提高。
使用Chef或Puppet之类的工具进行基础架构自动化是我在所管理的系统上实现的最好的事情。监视非常棒,但是,通常,要使各个部分与其余基础架构完美配合,需要进行大量工作。Chef和Puppet都非常擅长于自动化整个基础架构,并提供了很多手工编写的胶水。特别是将哪些服务器提供什么服务拼凑在一起。
Chef具有内置的查询服务器上其他节点上应用的属性和配方的功能,因此您可以询问谁是生产Web服务器,或者谁是数据库主服务器,这使自动化变得容易得多。Puppet也可以做到这一点,但是它需要一个外部节点分类工具,例如iClassify。
这将对Nagios和Munin等监视和趋势分析工具产生明显影响。例如,它还可以提供负载平衡环境的自动配置,因此LB可以查询特定应用需要涵盖的所有Web服务器。
我在各种环境中实现的另一个省时的方法是自动构建,例如kickstart(redhat / centos)和preseed(debian / ubuntu)。对于大多数人来说,这应该是显而易见的,但是令人惊讶的是,有多少站点仍使用CD来构建系统。如果自动构建使系统准备好运行Chef或Puppet来准备所有其他商品,那就更好了。
监视固然很好,但不确定是否可以节省时间。对我来说,这是集中式日志记录,它具有一个查看系统,该系统可以过滤掉平凡的事物,突出显示危险(磁盘故障,病毒扫描程序发现)并显示其他所有内容以便进行分类。
syslog(和perl)获胜。
基本上,它使我可以在吃百吉饼的同时读取网络上所有计算机的事件日志。至少要经过粗略的检查才能发现任何令人恐惧的东西。节省大量时间。
删除了所有用户的本地管理员权限。(如果我能)
这已经产生了效果,现在我不必处理任何问题,如何安装X应用程序(因为现在不允许这样做),我的计算机有病毒/间谍软件,我的计算机运行缓慢几乎与此有关的任何东西。
在遇到一个在审计,Windows更新等过程中完全错过的工作站之前,我从未想过这会使工作站变得多么稳定。它已经运行了大约4年,没有对其进行任何更新。我想我在Windows SP1上。该站点从来没有抱怨过任何问题,当我发现它时,我发现它运行得很好。
cfengine,用于在debian / linux下进行配置管理。
openvpn连接卫星站
tighvnc通过vpn到达卫星站中的2300 Windows客户端。
穆宁和纳吉奥斯,用于监测和报告
服务器上的smartmontools用于自动运行状况检查(以及状态邮件,如果出现问题)
服务器上的raid1(镜像)。如果一个磁盘出现故障,则服务器仍在运行-这对于我的时间管理来说确实很重要。
团队合作 -自己做所有事情是没有用的。分享工作,共同提高工作效率。
工作氛围尊重您的同伴,开玩笑和大笑-这对于营造积极和创新的氛围非常有用。
祝您工作愉快!男人,我爱我的工作!这让我真的很傻(我认为;)
当系统停机时,节省时间最重要。
我在标准化目录结构中的标准化文本文件中记录了所有支持合同信息。我有一个中心,并保留了多个副本。
信息的每一位(Web门户,电话号码,联系点,有效期,合同号,电话菜单快捷方式等)都以旧的.ini格式的标准标签(tag:data)开头。
查找电话号码就像转到顶层目录并运行以下命令一样简单:
grep Phone */*support.txt | more
第一个通配符扩展到供应商和/或产品名称的位置。
我之所以没有使用Excel,Word,OpenOffice,数据库等等等,仅仅是因为发生故障时,可能正是某些东西保留了您的支持信息。同样,这些也不容易从文本模式控制台屏幕上查看。
我还以相同的方式记录了所有操作方法。
到目前为止,我最大的省时方法是SSH密钥+ ssh-agent +密钥链,如本IBM关于OpenSSH密钥管理的文章中所述
没有更多的shell,脚本和scp密码。
注意:我的私钥上仍然有一个密码短语。
我找到了AutoIt,后来又找到了AutoHotkey,并坠入了爱河。
我最后的工作是为一家定制汽车制造商。汇编者是精通计算机的用户,设法使他们进入所从事的工作所需的程序崩溃。每天,每天几次,我不得不走到3座不同建筑物中的15多个工作站,杀死崩溃的程序,重新启动它,然后将其返回到数据输入屏幕。最终,我安装了VNC,因此可以远程进行操作,从而减少了旅行时间,但我仍然想起要经常进入并重置机器。当我找到AutoIt时,我意识到我可以将程序设置为监视计算机,并且如果5分钟内没有任何输入,它可以重置程序并键入并单击所需的所有内容以使其返回输入屏幕。
++用于中央身份验证和帐户管理,包括帐户创建和终止处理。我们拥有AD(两个目录林)和LDAP(以及直到最近的NDS),并且具有访问每个目录中现有资源的各种组。我们花了很多时间来使目录同步并在一个或另一个目录中管理所有资源,这是值得的。
下一个最大的赢利是任何数量的自动化,无论是帐户清理,配置集中化还是您拥有什么。
我不确定实际监视可以节省多少时间,但这是必不可少的。一个环境变得足够大或足够复杂,以使“手动检查”成为不可能和无效,这并不需要花费太多。另外,有时候睡觉很高兴。;)
这可能与对此的主要想法有所偏离,但是当我们标准化硬件平台时,我们也取得了巨大的胜利。我们选择了一个可在公司内部所有操作系统上使用的服务器平台,并且已经使用了几年。我们了解了硬件,并了解了其远程管理,它通过各种方式节省了时间和精力:
标准的,记录的和经过审查的操作系统版本也是如此。可能看起来很基本,但是我经常碰到那些商店不是标准的商店,也没完没了地去看看这个工具或那个工具是否存在或者特定服务器的设置是否正确。这种混乱甚至可以将最基本的任务和问题变成麻烦。
我最近在工作中实施了AntHill Pro,现在我们对许多项目的所有构建和部署都是完全自动化和跟踪的。这包括创建所有项目都使用的共享Tomcat部署Ant库,从而简化了AHP中这些项目的维护。下一步是为站点CDA部署创建类似的库。
虽然这并不能节省我个人的时间,但可以节省我们的开发人员和运营人员的时间。我喜欢为别人的车轮装油。:-)
我希望接下来看看Chef和Puppet,以帮助实现自动化的基础架构方面。
哦,文档对您有很大帮助。将人们指向一个写得很好的文档,而不是回答相同的问题20次,可以节省大量时间。