好的。经过例行清理之后,我的MDADM RAID5报告了mismatch_cnt =16。据我所知,这意味着尽管没有设备报告读取错误,但有16个块的数据和奇偶校验不一致。
问题1:能否获得这些区块的列表?
问题2:假设基础文件系统是EXT4,则可能存在#1,是否有办法识别与这些块关联的文件?
我确实有近线备份,并且在理想情况下,我可以将实时阵列与备份数据进行比较,以找到已被静默损坏的任何文件。但是现实是,召回6TB备份数据既昂贵又费时。知道在哪里寻找和恢复什么将大大简化事情。
(我应该注意,我只使用'check'选项运行RAID scrub。使用'repair'选项运行scrub似乎非常危险,因为MDADM只知道数据或奇偶校验是错误的,但不知道是哪一个。因此,MDADM似乎有50%的机会猜错并重建不正确的数据。因此,我希望知道哪些文件可能受到影响,以便在需要时可以从备份中还原它们。
任何建议,不胜感激!
icheck
+ ncheck
中debugfs
以基于扇区偏移量识别文件。
smartctl -a /dev/sda
以此类推),或使用其他任何方法对每个磁盘运行简短的SMART测试并打印完整的报告。其中一个很可能快要死了,并且要触发一个整体SMART健康警报,这需要很严重的麻烦。
dmesg
还是/ var / log / syslog?