古代服务器中的坏磁盘


12

我有一台运行1998年的Netware 3.12服务器,它可以在我们的校园中运行所有内容:总帐,采购,工资单,学生信息,成绩,您可以命名。该服务器具有两个卷的Adaptec RAID控制器:

  1. RAID 1、2个17GB scsi磁盘,Seagate ST318417W
  2. RAID 5、3个4GB scsi磁盘,2个Seagate ST34573W和1个ST34572W。

我们目前正处于替换该系统的项目的早期阶段,但是您不只是跳入这样的新系统,因此我需要保持该服务器的运行至少到2011年11月。

这周我们没有一个,但是两个硬盘发生了故障。幸运的是,它们来自不同的卷,并且我们现在能够继续运行,但是鉴于这些故障的本质,我严重怀疑我能否避免在11月目标之前从该服务器发生灾难性故障,而如果没有这种情况,恢复RAID冗余-在任何地方都只会再发生一个驱动器故障,而我已全力以赴。

我们很幸运能够在两个驱动器上摆放完全匹配的“备件”,但是备件处于未知状态。我尝试只交换它们,但是RAID控制器不够智能,无法处理此问题,并且使系统无法启动。

至于RAID控制器本身,我可以在POST期间通过Ctrl-A快捷键进入实用程序,但是从那里我无能为力。要实际管理卷,我必须首先启动Netware,这时我可以CI/O Array Management Software Version 2.0用来实际查看卷信息。我怀疑管理事物的正常方法是从带有控制器软件的特殊软盘启动,但是该软盘早已不复存在。

通过RAID软件中的选项,我认为在现有RAID卷中替换磁盘的唯一受支持的方法是物理添加磁盘,启动并将其配置为卷的“备用”,强制该卷使用备用磁盘以替换现有的故障磁盘(此时,我只是在猜测),以便故障磁盘成为备用磁盘,修复卷,从卷中删除备用磁盘,然后关闭并删除磁盘。然后从头开始处理其他发生故障的磁盘。假设我什至可以使它正常工作并且我的备用零件很有效,那么所有这些都将导致大量的停机时间。

至于寻找可靠的备件,我不知道从哪里开始寻找新的4GB scsi驱动器,甚至找不到我正在寻找的确切的scsi系统,因为它随着时间的推移经历了几次不同的迭代。

另一个选择是将其迁移到虚拟机(hyper-v),但是我们之前在该领域所做的所有尝试都未能走得很远。安装此机器时,我刚从高中毕业,因此它需要的网络软件和Dos知识比我以前开发的要低,或者如果我此后就已经忘记了(我也不是dos初学者)。

我的问题的部分原因是这是一台使用率很高的服务器,并且将其拆除几天来弄清楚问题并不能很好地解决。

至于这个问题,我正在寻找在这种情况下可能有用的任何东西:建议一个地方,以查找该时代的良好备件;使用类似控制器修复RAID卷的个人经验;或从虚拟机构建Hyper-V vm。旧的网络软件服务器,在软盘上安装了用于RAID控制器的更好软件的生产线,向内布拉斯加州的Novell顾问推荐的建议,它可以使事情正确,还有其他我尚未考虑的选择,等等。

更新:
对于备份,我们仅对数据进行了良好的备份(最近通过还原进行了验证),而对于实际运行事物的软件则没有。

更新2:
只是一个进度报告,我目前在VMWare Virtual Server 2.0中安装了可正常运行的Netware 3.12,这在很大程度上要归功于我在此处找到的指南:http :
//cerbulescubogdan.blogspot.com/2010/11/novell-netware-312 -on-vmware.html

下一步是准备空的网络软件卷以匹配现有服务器上的其他卷,将现有服务器上C:\驱动器和网络软件卷上的所有内容转储,并从该信息中找出需要向网络软件添加哪些模块,安装我的许可证(如果有的话,我们仍然有该磁盘),然后移动数据。

我已经批准在一年的第一天之后将服务器停机一周(可能不早于此),因此,除了创建空卷之外,其余的工作必须等到那时。

最终更新(2011年1月5日):
本周,我能够在两个RAID阵列中工作并且没有数据丢失。控制器现在都将两者都列为“ FAULT TOLLERANT”(是!)。我还能够以上次更新的进度为基础,现在在VMWare Server 2.0中具有功能正常的“备用”服务器。备用组件可以运行和使用我们的erp软件,但是我无法投入生产,因为我还不能从那个盒子打印(我也不知道为什么)。即使这样,如果我别无选择,该VM也会在紧要关头工作,并且在适应已修复的RAID阵列之间,我会适应这种情况,直到我在11月将机器扔掉为止。

结束语(2012年1月16日):
用全新系统替换此服务器的项目确实按计划进行。华友世纪不再有网络软件!全部赞SQL Server!国王死了。国王万岁!

我们仍然计划将旧服务器的运行时间保持更长的一段时间,直到8月我们的财政年度后审计完成为止。但是,如果不时发生故障,没有人会抱怨太多。


1
问题是什么?
andyhky 2010年

参见最后一段
Joel Coel 2010年

2
像其他人一样,我早在到达问题段落之前就失去了兴趣。您可能需要考虑重新格式化整个内容以使问题更早提出或简化。
John Gardeniers 2010年

2
我想对此进行透视(您可能已经知道):您的ENTIRE操作依靠一台12年使用的机器,您整整一年都无法更换。你有问题。
杰夫·费兰德

2
感谢您对项目的更新。我很高兴听到您的迁移成功。
海星2012年

Answers:


12

获取(并不断获得,每天或更频繁地)共享文件数据的备份好现在。如果您丢失了计算机,则可能无法找到恢复该磁盘所需的磁盘(是)。如果可能,还获取Netware引导出的DOS分区的副本。

听起来像Adaptec AAA-131 RAID卡(或那个时代)。如果我是对的,您将找不到更好的管理软件,因为没有更好的管理软件(请参阅http://www.adaptec.com/zh-cn/downloads/novell_netware/novell_netware/productid=aaa-131&dn=aaa-131 .html(最后可用的版本)。我使用了很多“回到过去”的卡片,它们工作正常。

如果是AAA-131 ,在使用其配置时要格外小心。无法配置RAID集,而无需擦除这些卡上的磁盘。这意味着,例如,如果您放下包装盒并连接一些测试磁盘,然后清除配置并在其中设置RAID,那么当您将“生产”磁盘重新插入时,将无法使用它们。无需先将其格式化。是的 真不好

Novell Netware将在VMware虚拟机管理程序中运行。我建议与具有不错的Novell Netware经验的人员(这里有人–我在看着您,Sysadmin1138 –有人员)签约,以帮助您将服务器的内容移到虚拟环境中, ,至少您可以继续进行下去。

如果您的客户端计算机是现代计算机,并且安装了Microsoft网络客户端,则可能会发现迁移到基于Windows Server的计算机实际上非常快捷。以与Netware服务器相同的名称启动Windows Server计算机,公开与Netware计算机具有相同UNC命名约定的共享目录结构,复制所有文件,并复制目标计算机上的权限(手动)。可能并没有那么困难,您可以事先在测试实验室中“分阶段”进行迁移,并用它测试一些客户端,以便从脚本/用户环境的角度决定需要更改的内容。

您可能可以从eBay获得一些备用硬件。不过,您所购买的该年份的任何产品也会遇到可靠性问题。

如果我是您,那么在那里的Windows Server将会带给您很好的帮助,以帮助您现在从那个盒子中进行迁移。可以让管理层花一些钱,使您几乎随时都可能丢失Netware包装盒中的所有内容。替换盒不需要强大的功能(考虑到要替换的内容),因此软件许可和备份将是您最大的成本。可以使用具有良好脚本编写能力并且可以计划通过登录和启动脚本更改与客户端相关的设置的详细信息的顾问来最大程度地减少与客户端相关的迁移问题。


我们在这台计算机上运行的校园管理软件需要使用Novell目录进行安全设置,否则,我会心跳加速。我会记住不要过多地使用RAID控制器。
乔尔·科尔

4
@Joel Coel:Yeeouch。糟透了 然后,将其尽快虚拟化。老式的RAID控制器将提供Int 13 BIOS,该BIOS将使DOS磁盘映像工具(如DOS的ol'GHOST)正常工作。我将获得所有Netware分区的逐个扇区映像,然后请某人帮助您将其迁移到虚拟磁盘中,以供您选择所需的虚拟机管理程序。
埃文·安德森

现在正在研究答案。
sysadmin1138

10

我知道,因为我做到了(嗨,埃文),所以VMWare确实有不错的NetWare支持。即使是真正古老的东西(您正在运行的东西)。那种老式的NetWare在空闲时不占用CPU而不是暂停CPU,因此将固定VM中提供的任何CPU。这就是VMWare Tools的用途,它们使其无法执行此操作。自90年代以来,VMWare就已经存在(甚至在BrainShare上有一个展位已经有几年了),而且必须这样做,这就是他们获得支持的原因。微软的虚拟化技术已经足够新颖,以至于他们从未对NetWare进行过虚拟化,因此它在那里不起作用。

如果此服务器的重要性如您所说,那么获得一些VMWare许可证应该很容易。至少要获得VMWare Workstation许可证,至少可以使该服务器进入虚拟环境。如果您确实需要,VMWare Server是免费的(我相信)。完成该工作后,您可以考虑将其移至类似ESXi的位置,直到可以对其进行正式替换为止。

还有其他选择,具体取决于您的Linux技能。Novell花了很多时间来获取Xen(不是KVM,Xen,尽管它们都使用qemu)来支持NetWare。它可能会与NW3.12一起使用,尽管您需要确保使用完整的虚拟化模式,而不是半虚拟化。

该服务器足够新,应该在其中装有CD-ROM驱动器,这可能是您的省钱之选。备份完成后,根据需要将其启动到ISO-Linux。它无法获取数据,但应该可以看到硬盘。此时,dd请将两个卷完整复制到网络上的其他位置。qemu可以将这些驱动器映像直接用作虚拟驱动器。

有多种方法可以将dd生成的映像转换为VMware VMDK,但我自己并未使用它们。谷歌他们,他们在那里。


Linux不支持某些旧的Adaptec RAID卡。可以使用DOS映像实用程序卡住OP(以便利用卡的Int13 BIOS)。我使用的一个很好的dd-to-vmdk实用程序是:sourceforge.net/projects/raw2vmdk
Evan Anderson 2010年

它确实具有CD驱动器,但事实证明驱动器不起作用:(
Joel Coel11年

5

就您的问题而言,这并没有真正的帮助(坦率地说,您已经拥有了备用磁盘,而我对于采购老式磁盘唯一有用的建议是“ 将驱动器型号输入Google Shopping ”),但是在您碰触其他任何内容之前您应该真正让DAMN确保您拥有良好的备份,并且可以在可用状态下成功将其还原到新计算机上

如果从描述中听起来这台机器至关重要,那么现在应该将其作为您的第零优先级。如果您有一段时间没有对备份进行成功的还原测试,则应假定它们一文不值,并且您需要确保在此计算机喘不过气而死于您时可以真正恢复。
如果另一个磁盘掉到了您的头上,而您没有可用的备份,那几乎就是问题。无论您是否准备就绪,您都将立即移至新系统。

我的$ 3.50。


同意 测试您的还原能力。#1第一件事。没有还原的方法,您可能还没有备份。(在那之前做到了。很烂。不要这样做。)
minamhere 2010年

2

其他人已经解决了备份等问题,因此我将不再重复。您可以采取几项措施来提高系统继续运行的机会。

首先要投资购买质量非常好的线路滤波器,然后将其放置在UPS和服务器之间。到那时,那些旧驱动器将对激增,峰值甚至很小的供应波动都非常敏感。

我从您的更新中看到,您已经安装了备用驱动器,但这是我的建议:在服务器中尝试备用驱动器之前,请将它们放在另一台计算机上,并用老化软件或如果有的话将其清除使用常规的路测软件无法获得连续的测试周期。在声明驱动器可信赖之前,请至少保持几天。众所周知,已存储的旧驱动器不可靠,一旦掉下来可能会发生故障。


1

上面的出色建议。也可以尝试-在备用的现代硬件上,尝试从上次完整备份中恢复整个系统。确保备用计算机不在网络上。

那是什么,我怕你会说?您没有备份和/或还原过程吗?好了,现在您知道下周要做什么?


1

仅回答双倍/三倍/四倍建议您每天备份一次,直到您确定解决方案为止。如果您无法轻松更换坏掉的驱动器,则唯一的解决方案是迁移到新驱动器。这是否意味着要构建新服务器,还是要缓慢迁移现有服务器以在现有服务器中使用新驱动器,这是唯一的选择。

在7年历史的RAID 5阵列中,我们有3个硬盘驱动器中有2个在一个晚上出现故障。我们的备份已严重过时。8天后又花费了17,000美元,一家数据恢复公司能够恢复我们的整个Exchange服务器,但没人满意。(除了我,因为我应该每天进行备份。在我要求的硬件上,但没人愿意为我购买,但是这个事实在其他所有人身上都消失了……)

这样做的好处是,客户立即批准了我6个月大的更换硬件购买请求。但是,天哪,这是一个非常紧张的八天。帮自己一个忙,现在进行备份,然后开始制定应急计划“在办公室中可以找到的任何硬件上启动并运行”备份计划。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.