功能性MD复杂RAID10突然将所有驱动器标记为备件
今天早上在长时间的〜1.5TB读取操作中向NFS客户端发送数据时,我的md complex-RAID10阵列自发停止,然后因为“非新鲜”而无法再次启动而丢弃了四个成员。检查mdstat会显示所有被视为“备件”的驱动器。 在Debian 7. 6x HGST Deskstar NAS上运行,四个在Marvell 88SE9230 PCIe附加卡上运行,两个在内部ICH7 SATA上运行。所有驱动器都通过SMART而无需重新分配。丢弃的四个驱动器都在Marvell卡上,但也是sda,sdb,sdc和sdd,我觉得它不一定是控制器,我已经测试过并继续正常工作。 我相信应该备份这个阵列上的所有数据,但我不确定它将处理的所有数据是非常重要的。我的存储工作流程现在处于转换状态,这些数据的备份到处都是。 我怎样才能让这件事重新开始?有些人建议失败并删除每个驱动器并重新添加它,有些人建议使用--force启动阵列,其他人仍然说要使用--assume-clean重新创建阵列,但所有人都只有其他RAID级别的经验。他们和我都不知道这些会如何与复杂的RAID10表现出来并且看起来不太好。 [UPDATE] 我发现设备名称已更改。这就是为什么OS驱动器是mdstat中的sdg(重启后),它是syslog中的sdc(因此是EXT4挂载消息)。现在我不相信被踢出的四个都是Marvell控制器。 我停止了1/3组装的阵列和--assemble --scan显示了四个驱动器“(可能已经过时)”并且它无法从剩下的两个驱动器构建。我再次手动使用--assemble --force并清除了由6个驱动器组装的FAULTY标志,但仍然无法启动数组,因为它们仍然标记为SPARE。因此,这让我了解如何将这些驱动器再次识别为RAID10的各自功能成员,如果可能的话...... mdstat: md0 : inactive sdf[0](S) sdd[5](S) sdc[4](S) sdb[3](S) sda[2](S) sde[1](S) 23441325072 blocks super 1.2 syslog: Dec 13 02:30:02 mWproduction rpc.mountd[2790]: authenticated mount request from 10.10.1.124:993 for /media/MainStore (/media/MainStore) Dec 13 02:33:22 mWproduction …