在同一建筑物内移动服务器


61

这是我的情况:我是一个继承(我不知道)位于办公室内的三台服务器的开发人员。我还继承了作为服务器的管理员的工作,但明显缺乏服务器管理知识,并且没有将google / ServerFault作为参考点。幸运的是,我从来没有真正接触过这些机器或解决任何问题,因为它们一直都是“正常工作”的。

所有三台机器都位于同一数据室中,并用于以下目的:

Machine1-托管许多内部应用程序的IIS 8.0-用于内部应用程序的
Machine2SQL Server 2008 R2数据存储
Machine3-SQL Server 2008 R2镜像存储Machine2

这三个都连接了外部硬盘驱动器,这些硬盘驱动器经常完成备份。

我被告知,所有三个都需要在同一场所从一个数据室转移到另一个数据室。我不会完成硬件的物理移动,这将由有能力的搬运工处理。

除了完成每个备份的完整备份外,在假设轻按电源开关并观察我的世界运转之前,我还需要考虑什么?

我知道三个人都位于同一个房间/场所中远非理想,但这已经超出了这个问题的范围。


3
即使与这一举动无关,您也已经有了一个计划,如果一个(或全部)主板/电源/磁盘死了,该怎么办?(因为它最终会发生)
Dusan Bajic

5
@spuder也许他们需要没有Internet的可用应用程序(他们说这是内部应用程序),或者他们只是不希望NSA参与其中。云技术不是灵丹妙药。
安德烈·伯瑞(AndréBorie)

27
这本身还不足以解决问题,但我建议您在移动之前先进行软关机和加电操作,以了解服务器成功开机后的工作方式。如果您之前没有对服务器进行电源重启,则可能会听到一些可怕的哔哔声或可忽略的错误消息。当您知道平滑的开机外观/声音以及耗时多久时,您将可以更好地判断移动后是否存在错误。
Stefan Mohr

2
依次重新启动每台计算机,并希望它能在没有任何错误的情况下恢复运行,然后再进行移动!
马特

7
@Matt至少他承认自己毫无头绪,并试图学习这是一件好事。我已经看到太多情况下,管理员是一个完全白痴,但甚至没有意识到这一点。
安德烈·伯瑞(AndréBorie)

Answers:


61

真正有趣的问题,很好问:)

在此举之前,您需要检查一些事情,一些容易,一些困难。

电源 -检查新机房不仅具有正确数量的电源插座,而且类型正确-与物理连接器类型一样,并且如果当前位置允许每台服务器使用不同的电源相位以防止单相故障,那么我强烈建议您也将其复制到新位置。

冷却 -您需要检查是否不会立即或逐渐形成热量,这些热量会导致过热并可能导致服务器关闭。通常,您可以从制造商的网站上查找每个服务器可以吸收的最大功率(瓦特)或热量(以BTU为单位)-让您的建筑经理知道这一点,并从他们那里获得书面确认,指出该位置的冷却将可以应对。 。

网络 -这是很难的-在旧位置和新位置之间不仅需要复制相同数量的端口,而且其类型,速度和最重要的配置也是如此。最后一点是关键-曾经有一段时间网络中的几乎所有端口都几乎相等-我年纪大了可以记住那些时间!但是这些天来,端口配置的数量以及任何一个端口可以在网络中放置的位置都是天文数字,您需要确保网络人员将一切复制到旧到新-再次以书面形式获得不容易 如果此举出了问题,我会投入资金,原因是网络端口不完全相同,它总是在发生。

“其他连接” -您是否知道服务器除了电源和网络连接之外是否还有其他连接?也许他们有到共​​享存储的光纤通道链接,到共享管理屏幕的KVM链接-如果您需要同样地复制它们,则同样。

除此之外,您还可以再提出任何更具体的问题,我希望此举能够顺利进行。


2
Chopper3的+1-我还要补充一点,这取决于您的网络配置方式,只有很小的可能性,您的网卡的MAC地址不会从旧的交换机中释放出来,并且Internet可能无法正常运行,具体取决于网络已建立。我知道,如果正确配置交换机,可能不会发生这种情况,但是我在大型环境中工作,并且这种情况经常发生,因此网络工程师必须手动清除MAC条目。
Mugurel '16

4
拆卸前拍下背板的照片。节省了很多时间。
Sobrique '16

1
一切。只需在照相手机上拍摄所有电缆的连接位置,插入的电缆和未插入的电缆的照片即可。(假设您被允许进入DC)。稍后再仔细检查是否发生了异常情况,这真的很不错。
Sobrique '16

2
所以啊“港口”然后-背板通常指的是完全不同的东西
Chopper3

2
@ Chopper3背板始终是指内部硬件组件,而不是“服务器外壳的背面”。除非这意味着失败的社交网络。
Christopher Schultz

27

其他答案涵盖此举的技术方面。您可能还需要考虑其他一些事项。

确保用户知道他们的应用程序在移动过程中将被关闭。您可能希望在非工作时间安排搬迁时间,以便最大程度地减少受影响的人数。

在启动服务器后,请一个有知识的人员(一个或多个)来测试应用程序。让他们做一些健全性检查,以确保应用程序按预期工作。

测试之后,告诉您的用户移动已完成,并让他们知道是否有任何问题。


18

要区分我们的格式是非常困难的。您需要检查的最重要的事情是,是否需要以任何方式重新配置网络,以确保它们可以继续使用相同的地址运行。即使它们可以保留相同的地址,也请确保未通过DHCP配置它们,并且/或者确认DHCP服务器在新位置可用。

旁注:正如您已经说过的,拥有SQL Server及其镜像并不是理想的选择。但是,将备份驱动器放在同一位置确实很危险。您需要将备份放在其他物理位置。


7
+1备份。它们不应该位于同一位置,而且备份的服务器也不能访问备份介质,否则其中一台服务器上的错误/恶意软件/破坏活动/勒索软件也可能破坏备份。目前可能没有预算,但请把它列入您的必做清单。
sdkks

16

其他答案也有很好的事前注意事项。但是,您还应该计划如何组织实际的举动。从事实Machine3是一面镜子机器2,它看起来像正常运行时间是在SQL Server 2008 R2数据库(一个或多个)一个显著的考虑。它是一面镜子的事实为您提供了机会。当主服务器不可用时,存在镜像的原因是可用的。这包括由于维护(包括搬迁)而无法使用。

制定计划:
您应该就如何进行搬迁制定一份书面计划。您可能需要将此计划或部分计划提供给处理部分工作的人员(例如,搬家工人)。该计划应包括所有行动前的活动,实际的行动和行动后的行动(例如,功能验证)。

移动基础知识:

  1. 移动Machine3(SQL Server镜像):使其完全正常运行。验证重新同步。
  2. 移动Machine2:使其完全运行。
  3. 移动机器1:使其完全运行。

此举的详细说明:

以下内容包括使用Machine3测试Machine1和/或Machine2的连接的两种方法(路径A和B)。您应该只使用一种方法。采取哪种方式,甚至使用哪种方式,都取决于问题中未包含的信息(例如,最终机器位置的物理隔离,机器的物理尺寸,网络/电源线的长度,扩展名的可用性,网络端口配置的相似性,正常运行时间需求等)。使用Machine3测试这些连接可能会增加Machine2的正常运行时间,但对于没有镜像的Machine1尤其如此。您可以选择使用其中一种方法,也可以都不使用。

  1. 首先移动Machine3

    • 现在暂时保留Machine1Machine2
    • 备份Machine3,然后将其关闭
    • Machine3完全移到新位置。
    • [路径B:如果要使用可选步骤#2 ,则不使用。]如果所有机器的网络和电源配置都相同:将计划用于Machine1的Machine3放置在计划用于Machine1的连接上。
    • 获取Machine3备份和运行。在新位置,验证它是否可以作为Machine2的镜像正常工作。这将提供物理验证,以确保所有问题(电源,网络等)的配置在新位置中均可用。
    • 解决出现的任何问题。
    • 在继续之前,请确认Machine3已与Machine2完全重新同步。
  2. 路径A :(可选):

    • 使用Machine3测试旨在用于Machine2Machine1的所有设施。
    • 关闭Machine3,然后将其移动/切换到Machine2的位置/连接(验证重新同步),然后使用Machine1(验证重新同步)。如果您打算这样做,则最初应该已经为Machine3设置了供Machine1Machine2最终使用的连接,因此您不必首先在Machine3的最终位置进行设置,然后再对其进行3次更改,但仅限于此 2通过使用其他机器之一的设备开始。
    • 在继续之前,请确认Machine3已与Machine2完全重新同步。
  3. 移动机器2

    • 您在Machine3上的练习应该可以使此操作更加流畅。
    • 备份Machine2,然后将其关闭
    • Machine2移到新位置;建立所有连接
    • 解决出现的任何问题。
    • 在继续之前,请验证Machine2是否已与Machine3完全重新同步。
  4. [路径B:如果您在可选步骤#2中测试了与Machine3的所有连接,则不需要]如果现在有Machine3将要在其中结束的Machine1

    • 关闭机器3
    • 将其移动到计划结束的位置(超出您要在Machine1定位的位置)。
    • 解决出现的任何问题。
    • 在继续之前,请确认Machine3已与Machine2完全重新同步。
  5. 移动机器1

    • 同时移动了Machine2Machine3(并希望通过让Machine3临时使用它们来测试Machine1将使用的实际连接),这应该是最平稳的移动。
    • 备份Machine1,然后将其关闭
    • Machine1移到新位置;建立所有连接
    • 解决出现的任何问题。
    • 如果Machine1应该占据的位置出现问题,则可以选择使用Machine3现在所在的位置。希望您已经能够通过Machine3使用一段时间(路径A或路径B)来测试Machine1位置中的所有设施。

7

如果任何服务器的IP都会发生变化,然后通过DNS解析连接到SQL框,那么您需要在移动的同时安排对DNS记录的更改。

您应该了解的有关Intranet软件和数据库的知识:

  • Intranet软件是否通过IP,NetBIOS或DNS连接到SQL Server?
  • Intranet软件使用的SQL Server用户帐户是否仅限于来自IP的流量进行身份验证?
  • 您公司的员工是否可以直接从任何电子表格或报表工具访问SQL Server,如果可以,他们如何定义DSN?

如果您没有获得完全相同的IP,或者您最终位于不同的子网中,则需要访问权限才能更改连接到SQL Server的任何应用程序的源代码或配置文件。人们可能依赖于未记录的直接SQL访问来进行临时报告。


2

利用您的“灾难恢复”服务器。在移动生产服务器时,请切换到它们来处理负载。使用正确配置的灾难恢复设备,您可以在一天中进行移动,而不会出现大量停机时间(最多15分钟)。由于灾难恢复服务器的配置方式应与生产服务器相同。如果您没有灾难恢复设备,我强烈建议您购买它们。

这样想:在您的护卫舰进行调校时,请使用小型货车度过一天。


6
您对一家公司感到惊讶,因为这家公司对没有经验的管理员拥有三台服务器感到惊讶。
RoadieRich

绝对,我假设一个正常运行的服务器实验室完全正常运行。或至少在一个地方,仍有一些旧服务器(或什至是个人电脑)仍在收集灰尘。重新配置它们只是为了移动。
Software_Programineer

1

我认为没有提到的一件事是服务器新家的物理安全性。房间以前用来做什么,谁拥有它的钥匙?是否有足够的安全性(警报系统,摄像机等)。


1

除其他答案外,还有一些注意事项:

  • 这些应用程序是否通过其他方式链接到其他应用程序,例如通过文件或使用Web服务的夜间数据交换?当应用程序不可用时会有什么后果?相关应用程序可以解决此问题吗?或者由于缺少应用程序信息而导致失败甚至产生错误结果吗?

  • 您的用户,公司甚至客户都可以接受停机时间吗?会持续多久?

  • 我认为制定回滚计划是一个好主意。您可以在无法快速解决的问题(例如网络问题)中使用它。对于将硬件带回的情况,您可能需要使移动器保持可用状态。

  • 您的应用程序是否导致高网络流量,并且是否需要为此做好网络准备(问题可能比地址和防火墙问题更不可能发生)?如果您具有实时应用程序(例如,视频会议软件),则延迟很重要。

  • 如果有服务器,则服务器必须适合服务器机架。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.