检查CentOS服务器上的硬盘错误/故障迹象


Answers:


3

我建议将smartmon(http://sourceforge.net/apps/trac/smartmontools/wiki)安装到您的计算机上,这是一些可以检查磁盘运行状况的软件,否则将检查/ var / log / messages或/ var / log / syslog中提及scsi错误的任何内容


smartmon看起来不错,尽管它的统计数据表明它只能捕获60%的故障驱动器。如果我将smartmon设置为每天扫描,这是否真的可以帮助HDD更快地死掉-这是希捷7200.10?
inac 2010年

@inac smartmon将帮助硬盘更快死掉吗?你在哪里读的?请添加一个URL。
030

2
dmesg

内核将记录有关I / O设备的所有诊断消息,因此您可以使用dmesg命令将这些消息检出。


但您必须手动运行此程序或将cronjob dmesg dump转至vi?
inac 2010年

要么。您可以创建一个脚本来使用“ dmesg> dmesg.dump.txt”转储该脚本,并每天使用cron运行该脚本。
Banjer 2010年

1

您可以在设备上运行fsck来检查错误。


0

正如Paul所说,SMART日志是检查的好地方。

我还建议运行BadBlocks。如果您有RAID卡,则可能必须在该卡上使用监视功能。


0

SMART监视是一个好方法。作为root用户,smartctl -a /dev/hda其中hda是您想要的驱动器...可以是hdb,sda等。还建议将/ etc / aliases中的电子邮件地址设置为应该获得root邮件的人。

不过,这是一个非常模糊的答案。如果您有任何大型制造商(戴尔,惠普等)制造的服务器,则可能会有更好的监视功能。


0

您可以尝试对/ dev / sda1分区进行全面检查(例如)

fsck -f /dev/sda1

或者,尝试对给定的分区进行全面的读-读非破坏性测试

badblocks -vn /dev/sda1

/dev/sda1 is mounted; it's not safe to run badblocks!
030

e2fsck: Cannot continue, aborting.
030

@ 030下降到未安装主磁盘的运行级别。
awiebe
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.