我应该如何关注ZFS镜像中的校验和错误?


3

我有一个自建的FreeNAS系统,它在一个ZFS池中使用4个硬盘纯粹用于存储,在ZFS镜像中使用2个镜像16GB USB记忆棒用于启动。它很稳定,已经运行了大约8个月。但是,隔夜电子邮件通常都是这样的:

Checking status of zfs pools:
 NAME           SIZE  ALLOC   FREE  EXPANDSZ   FRAG    CAP  DEDUP  HEALTH  ALTROOT
 freenas-boot  14.5G  1.67G  12.8G         -      -    11%  1.00x  ONLINE  -
 volume1       7.25T   457G  6.80T         -     2%     6%  1.00x  ONLINE  /mnt

游泳池:freenas-boot  州:在线 status:一个或多个设备遇到无法恢复的错误。一个         试图纠正错误。应用程序不受影响。 操作:确定是否需要更换设备,并清除错误         使用'zpool clear'或用'zpool replace'替换设备。    看到: http://illumos.org/msg/ZFS-8000-9P 扫描:在2016年10月23日03:51:22,在0h6m修复232K并修复0错误 配置:

NAME STATE READ WRITE CKSUM freenas-boot ONLINE 0 0 0 mirror-0 ONLINE 0 0 0 gptid / 253f05a3-be26-11e5-8d9c-d05099c04470 ONLINE 0 0 1 gptid / 879584e0-bfb0-11e5-ba20-d05099c04470 ONLINE 0 0 9

错误:没有已知的数据错误

校验和错误偶尔会增加,然后当我执行正常的FreeNAS更新时,将全部重置为0,然后进程将重复,校验和错误会一次又一次地上升。

我没有看到任何迹象表明HDD本身有任何故障,我在进行更改时将FreeNAS配置下载到外部备份位置,因此我应该能够在必要时重新安装新的闪存驱动器。

总而言之,我应该如何关注这些校验和错误?


Answers:


2

可能的原因

这些错误可能有不同的来源,一些受欢迎的包括:

  • 片状连接或电缆损坏
  • 突然断电或强行拆除设备
  • 如果使用有故障的非ECC RAM,则会出现内存错误

您可以清除错误 zpool clear,因为错误很少(而不是 too many errors 并且它们不会影响每个设备上的相同块。我怀疑FreeNAS升级也会这样做,所以它会导致你描述的情况。

可能的解决方案

我会做以下事情:

  • 运行memtest86 +隔夜以排除内存中的故障
  • 断开并重新连接所有电缆,检查连接是否丢失,如果需要更换电缆(它们很便宜,所以只需更换它们比故障排除更快)
  • 如果你住在一个能源供应不稳定的地区,请尝试使用UPS运行(在美国的某些地方发生了问题,我已阅读过)
  • 使用另一个或PCIe适配卡(相当便宜)测试USB端口/控制器是否出现故障
  • 尝试使用其他类型的USB记忆棒,我对基于SLC的USB3记忆棒有很好的体验(只有校验和错误被删除或停电)
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.