在数据中心中寻找的关键事项


34

我正在尝试建立一个简单的清单来确定数据中心的质量...我应该在哪里寻找什么,如何确定业主说的话(例如,“我们的UPS将数据中心保持100天无故障运行)。权力”)是真的吗?什么是典型标志或数据中心好坏?

Answers:


43

这是我上次去数据中心购物时为自己提出的问题清单:

  • 解释喷头在我们的设备上熄火所需的时间。
  • 远程人员愿意做什么?例如,安装硬盘驱动器,旋转磁带…
  • 提交票证后,您的远程操作员是否有24/7/365的平均等待时间才能到达笼子(如何输入票证?)?
  • 您在多个网格上吗?
  • 你有没有高架地板散热系统?
  • 除此之外,您还运营几个数据中心?
  • 数据中心可以使用备用电源运行多长时间?
  • 我们能否将设备直接交付给数据中心?
  • 是否有送货码头和免费,封闭且可用的停车位?
  • 如果我们有供应商来数据中心,我们是否需要陪伴他们?
  • 维持什么环境温度和湿度?
  • 有多少个ISP选择?
  • 您的任何客户在数据中心的历史记录中有没有失去过一段时间的电源?
  • 该数据中心已经运行了多长时间?
  • 地板和设备都有哪些访问控制?

如果您拜访了几个,并在价格,拜访印象以及他们的回答之间询问了这些问题,您可能会清楚地知道要哪个。确保您始终访问它们并访问大量它们。


2
做得好。+1给你。
gWaldo

3
我还想问一下地板和设备的访问控制。
Scott Pack 2010年

很棒的清单!!我要补充一点:“您拥有建筑物吗?” 另外,如果他们有洒水装置,那就走开!
JakeRobinson 2010年

消防法规甚至在许多地方的数据中心中,都需要@JakeRobinson洒水喷头。当您看到洒水装置时,请问他们是否是干管洒水装置。
sysadmin1138

3
@JakeRobinson我于2003年搬入的新DC既有FM200又有洒水器。消防长官非常坚决,那里肯定有洒水器。如果FM200可以扑灭大火,那就太好了。但是,如果不这样做(UPS的爆裂破坏了FM200空气坝,因此O2在倾倒后可以进入),大量的水将为建筑物节省资金。正确的干管系统意味着,如果洒水喷头受到撞击,DC不会溢出。
sysadmin1138

6

凯尔(Kyle)讲得不错,但有几点:

物理安全性是巨大的。要进入国会,几乎需要国会采取行动(议会,在这里插入缓慢的官僚机构)。

应该有哈龙灭火装置,不能洒水;服务器不应受潮。(当地的灭火法规可能会超越……)

找出他们首选的服务器供应商。除非是出于非常特定的原因(例如运行类似Google的数据中心),否则它应该是名牌服务器。(戴尔,惠普,IBM,Sun,苹果等)。如果他们说“白牌”或您不认识的品牌,请运行。请注意,有一些信誉良好的低层服务器供应商(例如System76)是信誉良好的,但是“定制”意味着他们将自己整合在一起。非常适合您的家庭,但不利于数据中心。(这不包括购买HP Proliant DL580和安装内存选件套件或驱动器仓之类的东西。)

有哪些所有权选项?通过他们购买?在那直接买货吗?租赁?虚拟机?


4
同意灭火,尽管“哈龙”的内容为“哈龙/ FM200 /氩石/惰性气体/其他灭火剂”
MadHatter支持Monica 2010年

11
实际上,许多地方的消防法规要求洒水喷头。我发现在2003年协助我进行的DC构建期间。仅当FM200不淬火热源时才着火。它应该是支持惰性气体的干管洒水系统。
sysadmin1138

2

一如既往的出色Kyle,我从经验中学到了以下几点:

  • 询问是否有发电机来备份UPS,是否对发电机进行了测试,多久进行一次?

  • 它们具有哪些物理锁和检查装置可以防止电工杀死电源?

  • 他们拥有什么责任/保险范围?

  • 不满足SLA时如何处理情况?

  • 他们多久未达到SLA?

  • 它们为每个机架/机架/箱等提供多少功率?(您是否会受到电源限制,只需要另一个机架/机架来获得额外的电源?)

  • 索取参考资料,在您的行业中会很好。

当时并不有趣的有趣故事:

  1. 温哥华的地下电气室发生火灾,距离我的直流电有4个街区,大火切断了半径10街区的电源。UPS一直保持亮起,直到发电机组上线为止。发电机组在过热之前已保持在线状态约一个小时。发电机组安全关闭后,UPS能够将灯再点亮30分钟。发电机属于该建筑物,IIRC DC能够责怪他们并洗了手。

  2. 一名电工杀死了DC上几排机架的电源,因为面板有些跌落,敲打了所有断路器。我还听说过另一个DC的电工要在UPS上工作,而不是将其置于旁路模式并关闭整个DC。


在这种情况下,建议使用机架式UPS,还是不要紧,因为无论如何通常都会断开连接?
AX1 2010年

太好了……我们的DC表示我们不允许在机架中安装UPS,这给了我们一个原因,但我不记得它是什么。
克林特(Clint)2010年

也许热?我没有太多有关机架式UPS的经验,但消费者UPS总是会变热。
AX1 2010年

4
@ AX1:菊花链中的UPS相互混乱。他们期望电流具有某些特性,其他UPS可以将其过滤掉。一旦DC断电,网络可能会关闭,因此即使您的服务器已启动,网络也不会关闭。
quinnr 2010年

可能是消防法规,如果EPO被击中,则消防人员期望没有带电。
肖恩·赖夫施奈德

1
  • 我想说的是,数据中心可能是三分之一的技术项目(您是否有{VESDA,加油合同,UPS覆盖的冷却器,多个电网,不同的光纤入口)。

  • 另外三分之一是当事情进展不顺利时,他们如何应对。他们是否会感到骄傲,检查失败并弄清楚该怎么做以确保不再发生?还是他们只是继续做以前没有做过的事情?

  • 另外三分之一是人员。他们聪明,易用且每个月都不会上班吗?

但更重要的是:它们是否具有您需要的空间?我们几乎进入了一个地方,两年之内,我们使用的空间超出了他们的可用空间。


1

我在硅谷的一个小型数据中心工作。我是公司托管服务器端的sysadmin。

不良迹象:

  • 缺乏对电源,温度,湿度的冗余监视和警报
  • 缺少对网络设备,colos,服务器和其他设备的监视
  • 混乱并且不使用电缆扎带或其他电缆管理来保持整洁有序的机架

良好的迹象:-具有自动故障转移功能的现场柴油发电机组-具有自动故障转移功能的备用冷水机组和空气处理器-主要运营商骨干网(AT&T,XO Comm)上的大量带宽-冗余网络提供商-冗余核心路由器,防火墙,负载平衡器和交换机-正在运行部署服务器之前进行内存检查和硬件诊断

名牌服务器很好,但是如果它们很旧并且已经出现了很多次,那么最好在使用它们之前确保它们通过了硬件诊断。

一个好的数据中心应该为客户提供一个网站,他们可以在其中监视其带宽消耗和正常运行时间。他们还应该回答任何问题。向他们询问其UPS的品牌和型号。要求他们查看UPS上的当前负载。借助此信息,您可以验证无电可以持续多长时间。

但老实说,UPS不应该成为您的问题。UPS仅提供短暂的正常运行时间(大约30分钟)。更好的担心是DC是否具有备用发电机。询问DC在哪个网格上也是值得的。在掉电和停电方面,将不同的优先级分配给不同的网格。你猜怎么了?医院和消防局是当务之急(永不断电)。如果数据中心在同一网格上,则保证其可靠的电源。

询问他们每个机架有多少电量。在我工作的地方,我们为每个机架提供3x 25amp电路。典型的1u服务器消耗1-3安培的电流。


我很想去的那个每个机架有40安培的电流。太低了吗?这几乎是您说的一半(75安培)。
AX1 2010年

1
@ AX1,110V时40A为4400W; 在230V时为9200W。除非是高密度(Twin / Twin ^ 2 / Blade)或HPC / GPU,否则就是PLENTY。
Mircea Chirea 2011年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.