系统管理员作业的Joel测试


142

基于“组织问题” – IT痛处? 我认为可以说系统管理员需要确定某个地方是否值得工作。乔尔(Joel)也有类似的程序员测试程序

系统管理员在面试中应该问的12个问题是什么,以帮助他们确定这是一个工作的好地方?

遵循Joel的规则:

  1. 问题应与平台和技术无关
  2. 问题应该引起简单的回答,例如是或否

编辑:请一次发布一个问题,以便我们可以看到用户正在投票。


2
问题-我们是否应该将每个问题放在一个单独的答案中,以便获得12个投票最多的问题?
布赖恩

我认为这可能是最好的工作方式。
尼克·卡瓦迪亚斯

2
Joel测试使用是/否问题,因此也许我们应该坚持使用这些类型,而不是“如何”或“描述”问题。
道格·卢森堡(

1
真正。但是问题也可以这样表达,即“除x之外的任何其他答案”也足够。每个组织的工作方式都不同,尽管Joel很好地提供了模板,但这并不意味着/ everyone /将遵循相同的/ kind /模板。
艾利·佩恩

数字7不符合问题标准。此外,如果没有有关工作及其环境的大量先验知识,对数字7的答案也将毫无价值。
John Gardeniers'7

Answers:


101

您是否使用事件/票务跟踪系统?


11
结果:它是否支持电子邮件和对话?我们在这里使用的系统将对您的问题回答“是”,但接近净损失。不可避免地会出现报告,并且服务台不会提出正确的问题。因此,其他人进来并进行了未记录的辅助信息收集,解决了该问题,并且没有做出任何记录的努力。至少使用一个临时的电子邮件线程,您会获得引用的对话历史记录。
jldugger,2009年

1
这确实是好是坏。某些票务系统最终阻碍了几乎所有其他工作,帮助台不断升级,仅是为了使票证脱离他们的境界。
sclarson

您需要一个事件系统来收集有关实际问题所在和/或再次发生的位置的统计信息。这是修复损坏的系统的良好基础,并且来自该系统的报告可帮助管理层了解这是您必须解决的有效问题。
奥斯卡·杜夫伯恩

1
问题和事件之间是有区别的。一种情况是事件。一旦发生某种事件,就可能成为问题。
geoffc


72
  • 在日常运营中还有多少人与我一起工作?

这会直接影响您的表演能力。它还会影响您进行不间断度假的能力...

  • 谁是问题的第一响应者?

这个答案会有所不同,但这很好地表明了组织如何实际“组织”。大型设置应具有服务台和票务系统;小型装置至少应具有售票系统,以及某种公司付费的寻呼机以寻求帮助。

“仅您”是不可接受的答案。这是一个完全缺乏组织性的问题,应跟进一个问题“如何跟踪用户的请求?”。这必须有回答的东西不是“你不知道”等。

  • 您现有系统与管理员的比例是多少?

该值不应太高(50:1以上)或太低(5:1以下)。太高了,您的工作量将变得如此之重,以至于您将不知所措以维持生计。太低了,您要么是一个人的商店,要么商店管理系统的能力存在严重问题。

与往常一样,规则也有例外。可以从一个来源(例如Web前端)对200多个系统进行映像的实例,以及业务规模很小(20名员工可能只需要2台服务器)的实例。

  • 最终用户/客户与管理员的比例是多少?

这是对期望的衡量。这些是您的“客户”。出现问题时,这将是解决问题所承受的“压力”。如果您的系统出现问题,那么一个只有5000个管理员和2个管理员的组织可能会非常紧张。

  • 最终用户/客户与现有系统的比例是多少?

这是服务器工作负载的一种度量。很高的比率可能是过度使用的迹象,或者预算限制会在需要扩展时束手无策。当不要求使用不足时,它也可能是一个问题(例如,HR有自己的服务器,但是在5,000个组织中只有5个“常规”用户的文件服务器是一个危险信号);这可能需要一些“虚拟化”来整合服务器...

  • 是否存在用于处理现有系统更新的现有流程,例如应用供应商补丁或固件更新?

除(a)“我不知道”或(b)“我们不更新”外,这应该是任何其他答案。

  • 假设服务器着火了。在发生危机或灾难时,什么时间可以作为停机时间?

这应该始终是一个合理的问题。如果面试官对这个问题不满意,那么他们将不了解您的工作性质,这是有关未来前景的重要线索。如果期望的是24/7全天候运行,那很好-除非他们没有为此提供基础设施,这意味着您将需要大量保姆。知道什么是可以接受的和不可接受的,有助于向他们提示他们的真实期望。

  • 说到火灾,您是否为您的设备配备了灭火系统,它是否合适?

洒水车是不是一个可以接受的答案。确实发生了这种情况,您得到一些组织,他们认为将机架塞进没有通风和扫帚高架的扫帚壁橱中是一个好主意。如果这被轻描淡写,忽视或怀有敌意,请站起来,感谢面试官,不要走路,跑...

  • 描述您的数据备份过程和使用的存储格式。

这是另一个问题,除了“我们没有”和“我们没有备份媒体”以外,其他任何问题都应该回答。

  • 您是否定期测试备份,以及多久测试一次?

上述问题的后续行动。如果您不定期进行测试,那只会带来麻烦。

  • 资本支出和小额采购是否有已知的预算和购买流程?您能给我解释一下我要购买东西的过程吗?

如果答案是“我们(别人)会根据需要购买”,那是一个危险信号。这意味着“我们不信任您在真正需要它时购买设备,因此我们会请别人来代替它”。 总是应该有某种预算。

购买商品的过程应该足够容易,以在不到2分钟的时间内进行解释。它的签约方不得超过2个方(较高的数字表示繁文tape节),并且周转应以天或小时为单位,而不是以数周为单位(如果购买时间过长,则会阻止紧急购买)。 总是应该有某种过程。

  • 您是否有计划刷新和回收旧硬件,它多久发生一次?

我实际上已经看到过运行支持18年的微型计算机的公司,这些计算机通过支持合同和支持供应商提供的大量备件得以维持。当然,原始硬件供应商早已离开...

台式机的更新绝不能快于3年,也不要慢于5年。在预算紧张的企业中,将台式机延长到5年有时是一个合适的答案。

关于回收的一点是对他们是否对旧硬件持“一次性”态度的测试。从某种意义上说,您应该通过已知的回收站适当地处理它,这是不好的;但从某种意义上讲,如果需要,您可以将旧硬件压入临时工作,这是好的。它还将使您了解它们的“骨骼”(保留的一堆旧硬件)的大小。

相关问题:

https://serverfault.com/questions/44638/how-often-does-tech-refresh-happen


5
不错的综合反应。“刷新和回收”对于服务器也很有趣。您不想去一家商店,而您将大部分时间都花在护理古老的服务器上,对吗?
Maximus Minimus,2009年

这里有很多要点,您是否有可能将其切碎并重新发布为单独的答案,以便我们知道社区如何优先考虑每个项目?
卡拉·玛菲亚(

很奇怪...是否有一个SO错误,允许具有170个代表的用户对答案进行编辑,但看不到编辑内容? serverfault.com/users/9113/joshperry在底部进行了两行编辑,但是我认为当有人进行编辑时,您可以公开看到它是谁...
Avery Payne

49

您是否有灾难恢复计划,其中包括IT吗?

好评如潮的后续行动:如果是,那么它是否包括整个组织,而不仅仅是IT?它是否包括人员,您是否定期对其进行测试?

相关问题:

制定灾难恢复计划的最佳实践或资源?


4
他们是否知道DR不仅仅是IT问题?许多地方仅在IT方面就认真考虑了灾难恢复,并且没有针对其纸质文件的计划。
Maximus Minimus,

是的,的确如此-尽管我也经常看到相反的情况:在办公室不可用的情况下,有很好的计划计划将高管人员和核心业务人员移至何处-但无论如何,都没有使IT正常运转的方法。服务器室与灾难计划所服务的办公室位于同一办公室,这确实很愚蠢……但是,话又说回来,他们在所有事情上都有很好的手动程序,这使他们可以很好地处理较短的IT中断。
奥斯卡·杜夫伯恩

4
答案“是的,我们已完全投保”不是有效的答案。
约瑟夫

1
您是否有DR计划,其中包括人员吗?如果建筑物烧毁,我会坐在那里……
Jeffrey Hulten

4
您会定期测试吗?
rom09年9

40

是否记录了当前环境?

政策和程序是否都记录在案并保持一致?


“如果明天要我被录用,而我的团队的其余成员明天在午餐时都“中了彩票”(或“死于意外事故”),那么文件是否足以管理环境?” AKA文档是否正确?真的正确吗?-Waldo
gWaldo

37

内部会计惯例是评估IT向其他部门提供的服务的价值,还是仅将IT视为成本中心?

(这与Stick的“ IT在您的组织中是优先事项还是有必要的邪恶?”几乎是相同的问题,但其措词是为了引出诚实的答案,而不是公然报出正确的谎言。)


我喜欢!有点管理
主义

9
是的 恐怕您需要管理人员来指定确切的问题。不能用68K机器语言破解至强,也不能用英语破解经理的大脑。
混乱

36

我认为必须具备的一台测试机具有与实时服务器相同的硬件规格。

“您的测试环境与生产环境的匹配程度如何?”


27
同样,我想说的一个问题应该是“您是否具有带有变更控制流程的单独的开发,阶段和生产系统?”
gharper

1
这应该是常规Joel测试的一部分。我无法告诉您我部署到PROD的次数,只是找到了一个我们没有看到的错误,因为Stress区域的功能是它的四倍!
tsilb

34

我发现很多答案都写成“你有这个吗?”,这很有趣。或“您是否定期执行此操作?” 如果我将被聘为新的系统管理员,那么如果这些东西尚不存在,我希望能够实现这些东西。灾难恢复和监视日志不会影响或破坏采访。如果他们没有做这些事情,他们将在我被录用之后。

正如我前面提到的,我主要关心的是来自上方的支持。如果我说我们需要更换服务器,我想从中受益。或者,如果我实施恼人的安全策略,那么我不希望合作伙伴向抱怨的人授予豁免权,这样他们就可以看起来像是个有爱心的老板。

系统管理员在公司结构的层次结构中处于陌生的位置。有时,他们根据最入门级人员的需求来制定方向并确定优先级,有时,他们在制定管理策略。我们同时处于链的最底层和最顶层。

我愿意在最底层扮演替罪羊和peon的角色,只要管理层在我处于最上层的情况下服从我的建议即可。


Joel Test并不是要“您错过了12个中的3个,因此我拒绝了您的报价”-它只是一个工具,可以帮助您最好地评估IT的当前状态并进行相应的协商。
卡拉·玛菲亚(

3
“如果他们不做这些事情,他们将在我被录用之后。” 如果您具有说服管理层相信他们应该根据您的需求进行更改的技能,那么我印象深刻。
tore-

33

所有购买的新系统/软件/应用程序是否都通过IT进行,IT是否有权拒绝和建议另一种系统,也许是另一部门已在使用的系统?


aka-公司的硬件标准化方法是什么?
卡拉玛菲亚

2
...以及软件(或简单的系统)标准化^^
Oskar Duveborn

5
这很有趣,因为它可能是负面的也可能是正面的-一个IT部门比支持业务对IT部门的权力更感兴趣,这可能是一个消极的环境。
拂尘

3
同样,我也确实依靠IT为任务选择最佳系统-但我看到了太多的例子,其中三个不同的办公室(SAME部门)试图购买不同的系统来表示销售/客户支持或电子钥匙-只是因为每个本地经销商的价格优势都不大... ...他们没有意识到集中运行的成本,并且对所有这些不同的系统负责IT操作与实际运行同一个上帝相比是巨大的该死的系统为每个人,并获得人们掌握它的协同效应。
Oskar Duveborn

2
这与电源跳闸无关,而与具有可管理的硬件标准有关。这绝对不是可选的。
卡拉·玛菲亚

32

您愿意花钱购买适当的监视/记录工具吗?

-或从最初的Joel测试问题开始:

您是否使用金钱可以买到的最好的工具?

相关问题:

服务器运行状况监视软件


11
我建议不要将其表述为“愿意花钱”,而应将其表述为“您是否使用(或促进使用)适当的监视日志记录工具”,因为监视某些最佳工具是免费的。Nagios,MRTG,仙人掌等
布赖恩(Brian)

4
甚至简单到“您是否知道服务器是否发生故障?”之类的简单内容。
尼克·卡瓦迪亚斯

3
某些最好的软件虽然不是完全免费的-取决于所监视的环境...
Oskar Duveborn

2
我会把它留为“愿意花钱”,因为像nagios这样的“免费”东西通常比开箱即用的解决方案要贵得多,而不是国会大厦花费管理时间,而这等于金钱(希望如此)。“将资源提供给”可能是管理人员在说“我们当然愿意花您的时间来解决我们的监控问题以及您成为系统管理员”
Jim B

3
O认为Joel所说的类似概念的方式是“您使用金钱可以买到的最好的工具吗?” 几乎所有可以想到的职业都适合我。
SingleNegationElimination


26

您是否使用通用管理员/根帐户登录?

在一堆“ yes”中间抛出“ no”答案总是很有趣。


更好的问题:您可以使用通用管理员帐户登录吗?(首先启用该帐户)。结论:需要执行哪些基本任务(如果有的话)作为通用超级用户/管理员登录?
SingleNegationElimination 2012年

23

IT是否有自己的预算?

我的不是,我们依靠其他部门的资金来满足我们所需的一切。很烂的时间。


这不是真的
吗?


18

我可以允许我继续接受培训和教育吗?您是否可以允许我购买一些资料以保证有关安全问题的最新信息?

您是否会支持我在政策和程序方面对员工的决定,无论这种决定多么不受欢迎?


1
对面试官来说,这样的问题表明您对为公司做出贡献不感兴趣,而只是想从中受益。它们也像危险信号一样行事:面试官可能会想知道,您遇到什么样的争议会导致您提出与后者类似的问题。

17

我要指出,对于那些喜欢在初创公司或早期公司工作的人来说,大多数答案很可能是“不,但是……”。该声明之后的内容通常非常有用。


16
  • 您有配置更改控制吗?
  • 您有数据恢复政策吗?
  • 您是否执行每日备份?
  • 您有问题数据库吗?

更新资料

  • 您有内置冗余吗?
  • 您是否拥有可以买到的最好的硬件钱?
  • 您可以一步一步设置新的笔记本电脑或台式机吗?
  • 您是否有定期修补的政策?

16

在您的组织中,IT是优先考虑的还是必要的?


3
在大多数公司中,我认为IT被视为一种支出而不是价值。
卢克M



11

您的系统管理员可以编写代码吗?


5
最好将其表述为“您的管理员是否分配了时间来使例行活动自动化?”
理查德


10

您是否为关键系统制定了响应时间策略/阈值?(或者,更好的说法是,“您是否已经熟悉了应该和不应该让我在凌晨3点起床的概念?”)


9

您可以一步一步添加新用户吗?

致敬:您可以一步一步构建吗?


9

我是唯一的系统管理员吗?成为唯一的系统管理员可能很好-实际上,这可能很有趣,但前提是企业了解导致我们执行以下操作的含义:

您有SLA吗?


12
如果第一个答案是“是”,则后续问题是“谁在休假/生病期间为我填补?” -然后您想与该人见面再做决定。如果没有人,那就去山上跑。
卡拉·马菲亚

另一方面,如果答案为“否”,那么您可能应该跟进“有多少其他答案?”。-特别是在顶级企业管理工作中。
Maximus Minimus,

8

询问他们,当他们说系统管理员时,它们实际上是指SA和DBA,Net Admin和Apache / IIS Admin,Email Admin和AD Admin以及桌面疑难解答程序。


取决于组织的规模,通常是!
尼克·卡瓦迪亚斯

而且我对此没有问题,但是很高兴找出您的帽子有多少种:)
wcm

一旦接受了董事级别的面试,才发现它实际上只是一名高端的solaris管理员。
ericslaw 2009年



7

您是否使用补丁程序/变更管理?

您是否执行每月/每年的灾难恢复测试?

IT是否负责并通过系统正常运行时间和工单来衡量?

您是否对所有IT部门都使用集中式票务管理?

员工可以在办公桌前打扰IT员工吗?

您的IT员工是否有为业务线创建解决方案的投入,还是只是遵循高层管理人员的指示?


5

您是否已将关键的硬件和软件平台保持许可状态并受到支持,即使在接近使用寿命时也是如此?


1
如果重要的是要占用建筑物中的空间,则重要的是要获得完整的供应商技术支持。
SingleNegationElimination

@TokenMacGuy:那不是管理层的想法
休伯特·卡里奥
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.