Answers:
第一个答案是保持冷静!我了解到恐慌常常使事情变得更糟的艰难方式。一旦做到这一点,下一步就是实际确定问题所在。用户和管理人员的投诉会从各个角度向您提出,告诉您他们不能做什么,但不能解决问题。
一旦知道了问题,就可以启动解决方案,并开始给生气的用户一个时间表!
保持冷静
不要惊慌。呼吸!(通过隔膜,它会有所帮助。)如果您学习过冥想,那也可以有所帮助。
面对极端压力时,您的身体会进入逃避或战斗模式,因为您的身体认为自己处于生死攸关的情况。此时,您的身体实际上会向大脑的某些部分泵送更少的血液,从而减少推理功能。由于本能而非理性开始支配大脑功能,因此有效降低了智商。如果您曾经去过或目睹过激烈的争论,您可能会认识到这些症状,因为人们的情绪高涨,理性需要放假。后来,当人们有机会冷静下来时,他们将更有可能接受犯错或犯错,并且更有能力看到另一面,但就目前而言,却并非如此。
保持镇定自若并保持智慧,可以使大脑充分发挥作用,并确保您基于证据和理性做出理性的决定,而不是基于情感和恐惧。
分流
在这里,有效利用有限的资源以最低的成本获得最大的收益至关重要。尽早做出决定,哪些事情必须立即解决,哪些可以等待一会儿(几小时,几天),哪些可以无限期地等待。还要学会认识到什么东西无法挽救且不值得保存(例如,路由器融化了一半,即使它是您唯一的路由器,您也无法保存,购买新的路由器并在事后收集或在现场找到可以解决的问题)暂时填补空白)。
保持情境意识
不要让您的注意力被一些有趣的问题或尚未完全了解的事情所困扰。始终专注于全局并着眼于最重要的事情。
使用科学方法
形成假设。确定如何检验该假设。收集数据以检验假设。还要查找确认数据。优化假设,并根据需要重复多次循环,直到您对假设有足够的信心采取行动为止。
务实
现在不是教条的时候。从灾难中恢复时,可以在这里或那里采取一些捷径。这实质上是在累积技术债务。在许多公司中,灾难性的失败意味着收入的灾难性损失。最好是让事情顺利进行,即使步履蹒跚,也不要轻描淡写,冒着公司生计的风险。与往常一样,这里的判断至关重要。有时候,用指点服务器机架上的机箱风扇是有意义的,有时候却不是。
照顾自己
您在这种紧急情况下工作了多长时间了?您最后一次喝水是什么时候?您上一次吃饭是什么时候?你醒了多久了?不要仅仅因为发生紧急情况而使自己筋疲力尽,请花时间保持水分,进食和休息(以防长时间漫长的跋涉)。
招聘帮助
几乎可以肯定的是,您公司中有很多才华横溢且有能力提供帮助的人才。小心不要让太多的人到处乱跑,并互相造成麻烦。也要警惕通过“射击”使人烦恼。寻找已经想要帮助的人,让他们从事有针对性的任务,并确保人们彼此交流。
通信
沟通至关重要。没有什么比未知更可怕。当人们只知道某个东西坏了而已时,一个虚假的声明将在X个小时内备份只是空洞的保证(在X个小时过去之后,即使事情仍然坏了,保证也更少)。游戏中的压力会引导您做出过于乐观的WAG时间估计,但这是错误的做法。不要只是说您正在为此而努力,也不只是说事情将在X时间之前解决。开放,展示您的过程,详细说明您的进度和挫折。提供对问题的了解,跟踪问题的过程以及修复问题的计划(尽管不要淹没细节)。表明问题不是棘手的,表明事情将最终得到解决,表明有能力的人解决这个问题,
立即预订飞往非引渡国家的航班
首先检查基础知识,这似乎很愚蠢,但是类似
我知道当问题上游时,浪费大量时间寻找解决方案
我ping的东西。之后,根据ping的结果,发生的变化会很大。
抱歉,这个问题已经在“ 最喜欢的sysadmin”卡通中得到了完美的回答:
让人们知道您正在努力,并在可能的情况下给他们一个估计情况何时会恢复正常的信息。
至于实际的故障排除,显然取决于出了什么问题。我通常会收集各种服务的“检查状态”脚本。
检查电缆!当一个简单的Eth0电缆交换可以解决问题时,我已经浪费了很多时间检查其他东西...
我喜欢此故障排除列表,“ 简单故障排除应用程序现在可以解决所有问题”)
从声明中很难提供一组特定的操作。您的第一步将基于:
显然,您需要保持冷静,并对即将发生的问题保持警惕。您在网络故障排除方面的经验将告诉您,这很可能是微不足道的,例如:
话虽如此,在以下类别中也可能是严重的事情:
关键部分是您对该问题了解多少。你的参考点是什么?(从什么角度来看,“系统崩溃”了?)。