Answers:
几年前,我做了一份工作,对一家小型制造公司的网络基础架构进行了“评估”。在那次工作中,我发现他们的ERP系统从未备份过。他们不知道,他们的前IT承包商将Backup Exec配置为每日完整备份,但从未编写过脚本来编写其ERP系统使用的任何类型的“转储”或停止/启动数据库服务器的脚本,因此数据库文件始终处于使用状态,并且被ERP跳过。备份。因此,超过3年的时间,他们每天执行磁带备份,而磁带备份中没有ERP系统的任何数据。他们像承包商告诉他们的那样,尽职尽责地更换了录像带,但显然没有人(包括承包商)费心检查磁带上的实际内容。
曾经有一次,我们的一位高级管理人员离开了我们的组织,并将“文档映像系统”的职责移交给了我。我是团队中的低矮人,缺乏经验,渴望跳入任何事物。
就像是老迈可·格林(Mean Joe Green)的可口可乐广告片一样。。。 “希望他把一大堆弄皱的纸扔给我,上面有一些登录信息和一个电话号码,而不是一条汗湿的毛巾。
欣快感很快消失了……该系统由2个运行数据库的服务器,一个共享,大约6个带有扫描仪和处理应用程序的工作站以及一个登录用于引用文档的Web服务器和应用程序用户组成。这是对Apache和Java以及Windows SQL Server上运行的至少两种类型的脚本的恶意混搭。哦耶。我们还支付了一系列经常失败的“定制”费用,并且他们的支持人员总是幸福地没有意识到。
好时光短名单:
几乎没有记录任何东西,当东西破裂时我发现了每一个皱纹。就像说...报告有误或没有打印。或Desktop推送了新版本的JVM,没有人可以扫描。或者有人将加密狗从扫描工作站上踢了下来,应用程序崩溃了。或日志文件系统已满。或由于错误捕获某些内容并将其提交为非法内容而导致的OCR提取数据使应用程序崩溃。或者发现大约有3打票在不同部门的支持下开放,其中许多已经开放了几个月。等等,我以每周4-5的速度发现了重要的新事物,并开始非常迅速地了解该应用程序的来龙去脉及其需求以及足够的SQL Server,以保持数据库适度健康。
最好的部分是当我被邀请参加内部用户组会议以“欢迎”我担任新职务时。我不骗你 一圈有30个生气的用户,我不得不坐在中间。
这很粗糙,但是我很快就学到了很多。除了所有的痛苦,这是一个巨大的机会。我的一部分希望它不是那么一帆风顺,但也许我不会学得那么快。
抱歉,时间太长了...但是啊...就像疗法;)
大约12年前,我开始在中型ISP担任sysadmin的工作,大约有30名员工在那儿工作。他们以前从来没有真正拥有过真正的sysadmin,只有一些认为自己知道自己在做什么的人(有时他们是对的,但大多数情况下他们并不正确。总的来说,这些系统完全可以正常工作)。
锦上添花的是,几乎每个地方的人都有服务器的根密码。我对接待员一无所知,但可以肯定的是,所有经理,服务台人员,Web开发人员以及与该系统进行交互的其他任何人都具有根源-现有员工和过去的员工,因为他们从未更改过。他们都会使用它。一时兴起。例如,如果某个客户投诉而致电服务台,他们将以root用户身份登录并混乱整个系统,直到该特定客户的问题得到解决或以某种方式神奇地停止了发生(被他们视为“已解决”)。当然,这会导致许多其他问题。...帮助台上的其他人将同时使用相同的“以root用户身份登录并管理系统”方法来处理该问题。
自然,更改根密码并建立更改管理和其他过程来控制更改的内容以及更改的时间,方式和对象,这是我做的第一件事。哦,是的。。。还有配置文件的备份和修订控制。
(我所做的第一件事就是关闭开放的中继邮件服务器并实施一些反垃圾邮件过滤。实际上,我确信我能胜任该任务,因为我在采访中提到我做了相当多的反-垃圾邮件工作。我不知道,他们有一个严重的垃圾邮件/开放中继问题,这种问题已经持续了好几个月了,他们不知道如何解决,因此他们不断被列入黑名单。几乎每个地方的人都具有root用户访问权限)
最初,让root priv脱身会引起很多愤怒,但是幸运的是,我的老板支持我以及我正在努力实现的目标,他们很快意识到服务器比以前更加可靠(不是考虑到对可怜的事情做了什么,很难实现)
完全标准化的小型网络:Windows 95和NT Server。
是几个星期前。;-/
轻松完成了IS Manager的第一项工作,在dBase中找到了一个由AP店员的丈夫编写的自定义订单输入应用程序,您可以查看屏幕并告诉他们编码的顺序,因为他在学习过程中就学会了,一些屏幕是久违的,其他的屏幕看起来像是一个雨盒。许多文件会强制性地锁定特定文件,因此一次只能有一位客户服务代表可以编辑客户主数据。
通过便宜的双绞线连接器(非压接),添加到远程办公室的此瘦网同轴电缆中。对电话进行故障排除时,首先要说网络已断开,然后我问是否有人搬走了家具,计算机,清洁人员是否正在吸尘……如果有人呼吸电缆,连接器就会松动到足以断开令牌环,但在看得见它们松动的地方还不够。
然后,所有者将带着一份USNews的副本从商务旅行中回来,并指向一则计算机广告,然后说:“我们为什么不使用这些服务器?” 有一阵子我以为我住在《迪尔伯特卡通》里。我只知道Scott Adams在跟踪我,做笔记...
哦。这就是我开始这项工作的方式。
那是在2000年,当时是一家小型ISP。在塔式机箱中,大多数服务器都是Pentium 1-类“服务器”硬件。对于DNS和RADIUS身份验证,这不是问题,它们实际上可以继续使用很多年,但是真正的症结在于,一切都是BSD / OS 4.2。尽管我对FreeBSD和FreeBSD相当熟悉(实际上我在第一份工作中就使用过该版本的BSD),但说到那时它已经过时了,这是一种轻描淡写的说法。什么是一个问题是邮件服务器和Web服务器。它们是速度稍快的机器,但超负荷运转。我认为硬件没有那么强大。更像是台式计算机,它们很幸运(?)不会死。自公司1994年成立以来,没有任何升级。所有设备都塞在办公室的一个角落,巧合的是,那里没有足够的空调。当我说“办公室”时,我的意思是每个人都有一个房间。过去曾发生过几次因高温导致服务器故障的情况。
好的,古老的体系结构:检查一下。
以前的系统管理员:完全不能胜任,只持续了几个月,我认为他只是在不知不觉中才开始启动新的计费数据库(并从其旧的计费系统:纸张转换)。在此之前:是公司的所有者,他足够了解创建帐户,访问网站以及启动已停止的服务器的知识。也许还不止于此。有时他得到朋友的帮助。谁实际上是一名房地产经纪人。老板对系统管理员的态度是:“谁需要他们?您要付给某人4万美元,让他们围坐在一边喝咖啡,一边阅读日志。我需要技术支持代表。”
安全性:无。不,真的。T1为服务器提供了Internet连接。还有办公室 固定所有内容的公共IP。老板的态度:“哦,我们很安全。我们正在运行BSD / OS 4.2!从来没有闯入过!” 至少密码没有被完全阻止,但是每台默认服务器都在每台机器上运行。当然没有补丁。每个服务器守护程序的古代版本也是如此。
火灾:无处不在!一切!上!!火!!!我被雇用后一周内就做了第一件事(我可能会补充说,作为技术支持。也想做系统管理吗?在您不忙的时候做那件事-我还很年轻,很穷,根本不在乎)敲定一个shell脚本,该脚本将控制客户可以同时登录拨号池的次数。这解决了拨号池一直忙着的最紧迫的问题-由于垃圾邮件发送者将其用作聚合带宽的方法。我是否提到过AAA RADIUS服务器在该版本中没有此功能?新的AAA RADIUS服务器也无法在该平台上编译吗?FreeRADIUS也不能吗?请参阅第1节,旧硬件。后来我什至做了同样的事情来实现实际啊,会计拨号上网,这样每月注册30个小时的人就不会每月使用300个小时。我似乎还记得,邮件服务器不是开放式中继,但可能已经开放。另一方面,由于sendmail(无论使用哪种旧版本)仍然使用mbox格式,该格式要求将每个邮件解析为一个平面文件,而不是Maildir格式的邮箱(每个文件包含一个邮件),这实在是太可怕了。 。因此,如果有人用大邮箱检查过他们的邮件时,服务器地停顿了大家。当然,传出SMTP和POP位于同一台计算机上。当然,没有垃圾邮件过滤功能。在传入或传出邮件上。除了每个新站点都是手动添加的事实之外,我不记得Web服务器出了什么问题。事实已经够糟糕了。
备份:备份?哈哈哈哈哈!啊!
然而,这个地方最令人困惑的是没有打印服务器。想打印文件吗?从办公桌上起来,将开关箱上的转盘转到计算机上,然后返回并打印文件。我记得不久也解决了这个问题。
我当前的Domino环境必须是这样。以前的长期任职者之一只是对快速而肮脏的开发工作感兴趣,因此10年来绝对没有进行任何基本的家政工作。可以理解的是,跟随他但先于我的两个人看了一眼,便决定低着头。因此,现在我完全没有标准化的命名约定,遍布ACL的用户帐户,老管理员和开发人员长期以来仍然使用帐户(并且仍然属于敏感组),一半的用户使用相同的密码,其中有一半的密码记录在电子表格中,其中有一个漂亮的关键业务应用程序,带有两个自定义内部安全数据库除标准ACL之外,还有超过1000个数据库(包括“副本的副本副本”)经过4或5次快速而肮脏的升级,然后才冻结为版本6级别,并且几乎每天都会损坏。顺便说一句,他对Windows可扩展性也很偏执,所以我有8个CPU的盒子。
把它带到外面去射击将是一个怜悯。
这个问题使我的头部受伤。我为州政府工作...最低出价胜出!
当我接任现职时,我花了2周的时间与那个逃跑的家伙一起工作,主要是编写Web应用程序,他花了6个月的时间与承包商合作,所以我对应用程序当时的运行情况有一个很好的了解投产。一个月后,该应用被废弃,他们向承包商扔了钱才走了。我仍在处理vb6应用程序,而没有文档,这些文档有时会调用我什至没有代码的其他应用程序!
我什至不打算讨论所有怪异的服务器配置,跨过繁华街道的异地备份,或者整个其他部门“处理”我们的路由器和交换机(哦,他们说是通过重新布线无需成本就可以建设!当然不用了,现在他们只需收取端口费并阻止双MAC!我们为了上帝的缘故使用SIP电话!而且我们必须证明安装测试机的成本是合理的。
我必须停下来,这会让我哭泣。我每天都为政府所做的任何事情感到惊讶。
当我开始在目前的公司工作时,他们使用的是Small Business Server 2003,最终我们发展到必须从SBS2003切换到实际的“真实”服务器环境的地步。不幸的是,过渡包对我们不起作用,而MS通过我们最近购买的批量许可帮助我过渡了所有内容。通过帮助,我的意思是给我列出一些需要移动和更改的内容,但不完全是要列出的内容。
现在,我的Active Directory的肠子,但的东西,他们没有告诉我是SBS如何做一个漂亮的内精通NOT就像带走FSMO角色之一,8或12小时后会重新引导到展示如何生气没错。
下SBS2003是一场噩梦,偶尔我会在AD中看到SBS引用,或者在这里和那里看到对旧SBS服务器的引用,到现在已经有2年了。
哦,顺便说一句,我讨厌SBS!:)
Windows 2003服务器,也是DC,运行Exchange2003。到目前为止还很糟糕,但是请耐心等待,还有更多...它还是终端服务器,SQL服务器,Web和FTP服务器,WSUS服务器,防病毒更新和中央配置服务器并托管用户的漫游配置文件。它也是使用DAT磁带的中央备份服务器。
还不够好吗?该计算机具有一个CPU,2GB RAM和一对配置为RAID 1的7,200 RPM SATA驱动器。该阵列被划分为2个逻辑驱动器,系统驱动器为16GB,其中少于2GB的可用空间。该机器是由承包商推荐的二手设备,由二手零件组装而成,毫无疑问,这取决于他所提供的零件,并且收取的费用几乎相当于一台像样的新服务器的成本。他还负责机器的配置和调试。他的建议被接受,因为他已经与客户打交道了近十年。我确保他不再与他们打交道。
我的第一份工作涉及计划从18岁以上的“ Point 4”小型计算机迁移。他们想对设备进行现代化改造,“因为业主认为现有设备已经老化了”。这台老式的分时共享微型计算机使用了带有自定义ROM的重新贴标的Televideo 955终端,市场上总共有1个终端仿真程序,可让您将计算机连接到该终端以用作哑终端。当然,该程序仅在系统7上运行。
供应商早已倒闭。零件是由硬件支持供应商提供的,并有一份年度合同,并且由于其他故障和需要更换,它们每几个月要出访一次。
我提出的最大问题是物理问题,而不是软件问题。服务器壁橱也恰好是电气和电话壁橱。因此,它可以通过将房间加热的巨型变压器的形式来进行气候控制。壁橱也离开了一个用于举行小型会议的房间。我必须张贴告示牌,告诉人们即使嘈杂也不要关闭壁橱的门。幸运的是,主楼的空调足够,温度没有发生故障。接线工作也有些混乱。从开关到服务器,您的标准老鼠几乎都筑巢。最好的部分是,其中一个机架与其他两个机架分开,因此机架之间有一条小走道。它只有一台服务器,它的电源线只是在没有保护装置的情况下穿过地板,也没有平放。这使您可以轻松地踩到它们。当您跌倒并要面对植物后,懒洋洋地穿过的脖子高跳线会抓住您并试图折断您的脖子。
在我们将办公室(带REAL AC的服务器机房!)搬到办公室之前,我没有机会把补丁贴到天花板上,但是我整个壁橱上都用魔术贴绑了起来。在那之后,您实际上可以漫步而不会自杀!
我刚到的那家公司工作时,有一台办公室服务器(两个硬盘驱动器,一个甚至没有安装更少的镜像)和一个租用的托管服务器,总共一个硬盘。根本没有磁带备份。
局域网的其余部分都面临挑战-但是像这样运作三年多的运气真是太神奇了。没有镜像,没有冗余,没有磁带。
一个Informix数据库,其最繁忙,最重要的任务表具有16k扩展盘区,在表空间(认为是碎片磁盘)上多达38,000个扩展盘区,是支持级别的两倍。(供应商实际上写了一封纸质信,上面写着“您的数据库随时会崩溃”之类的内容。)
之前的DBA,SA和网络人员离开了,而我大约停课了6个星期。我进行了大量研究,并弄清楚了解决该问题的方法,这将需要6个小时的停机时间。老板拒绝安排停机。
因此,在一年中最忙的日子之一,系统冻结。500个呼叫中心运营商和一个商务网站关闭。失败后修复它很困难,因为供应商以前从未在具有这种大小的表上使用过类似我们正在使用的“有趣的”数据库模式的表。因此,除了数据库完整性检查花费了额外的5个小时外,我们完全按照最初计划进行了工作。
客户有5名员工。他们的旧IT人员使用低端游戏PC设备定制建造了2台服务器。1也是运行交换的域控制器。另一个是终端服务器。每个员工都使用瘦客户端连接服务器并在服务器上工作。两者都运行Windows 2000并在5年前构建。不用说,当低端RAID卡在彼此之间相隔两天之内都死于两台服务器时,我用标准的hp服务器替换了这些服务器,并使用常规的小型立式机将其安装。我还把服务器放在自己的UPS单元上,而不是让它们都在同一个UPS单元上运行,没有WAP和监视面糊备份。
最重要的是,他们在办公室中有6台网络打印机,其中2台使用DHCP。另外四个已经分配了IP,但是它们分散在委托的IP范围内,没有文档。
令人难过,但是经过一个月的调整(旧的巫师并没有很好地适应他们的工作方式的改变),现在他们很少打电话了。
我被要求修复性能不佳的MySQL系统,只是发现其中的一个不正确的标头元素/etc/my.cnf
导致所有他们尝试使用的良好调整参数都被忽略,而使用默认值...
因此,我们使用InnoDB数据库引擎在具有16Gb RAM的服务器上拥有一个7Gb db的系统...
对于InnoDB ,错误的配置被设置为12 Gb RAM。
系统仅为InnoBD 使用128 Mb的RAM ...因此,每个查询和更新的磁盘活动均为/ lot /!
快速修复标头,重新启动MySQL服务,然后嘿,一切都被缓存并表现出色:)
奇怪的是,没有人考虑过检查他们所应用的调整参数是否正在实际使用中!!:-/