重新启动后出现“陈旧的NFS文件句柄”


16

在服务器节点上,可以访问导出的文件夹。但是,重新启动后(服务器和客户端),都无法从客户端访问该文件夹。

在服务器上

# ls /data
Folder1
Forlder2

并且/ etc / exports文件包含

/data 192.168.1.0/24(rw,no_subtree_check,async,no_root_squash)

在客户端上

# ls /data
ls: cannot access /data: Stale NFS file handle

我不得不说,客户端的共享文件夹没有问题,但是在重新启动(服务器和客户端)后,我看到了此消息。

有什么办法解决吗?

Answers:


22

重新启动的顺序很重要。客户端后重新启动服务器可能会导致这种情况。过时的NFS句柄指示客户端已打开文件,但服务器不再识别该文件句柄。在某些情况下,NFS将在超时后清理其数据结构。在其他情况下,您需要自己清理NFS数据结构,然后再重新启动NFS。这些结构的位置在某种程度上取决于O / S。

尝试先在服务器上然后在客户端上重新启动NFS。这可能会清除文件句柄。

不建议使用从其他服务器打开的文件来重新引导NFS服务器。如果打开的文件已在服务器上删除,则这尤其成问题。服务器可能会保持文件打开状态,直到重新启动为止,但是重新启动会删除服务器端的内存文件句柄。然后,客户端将不再能够打开文件。

确定已经从服务器使用了哪些安装是困难且不可靠的。该showmount -a选项可能显示一些活动的安装,但可能不会报告所有活动的安装。锁定的文件更容易识别,但是需要启用锁定,并且需要依靠客户端软件来锁定文件。

您可以lsof在客户端上使用以标识在挂载上打开了文件的进程。

我在NFS挂载上使用hardintr挂载选项。该hard选项将导致无限期重试IO。该intr选项允许进程在等待NFS IO完成时被杀死。


使用hard, intr是一个很好的建议。但是,请注意,每次尝试NFS会使超时加倍。所以,你最好的设置timeo=1retrans=5左右。请注意,这在NFS重新启动后给您的NFS服务器带来沉重的负担。尝试不要经常重启NFS服务;)
bjanssen 2014年

您的回答是正确的。我还找到了另一个简单的解决方案。在显示过时的NFS处理程序的节点上,只需重新挂载并重新挂载该文件夹。
mahmood 2014年

4

试试我写的这个脚本:

#!/bin/bash
# Purpose:
# Detect Stale File handle and remove it
# Script created: July 29, 2015 by Birgit Ducarroz
# Last modification: --
#

# Detect Stale file handle and write output into a variable and then into a file
mounts=`df 2>&1 | grep 'Stale file handle' |awk '{print ""$2"" }' > NFS_stales.txt`
# Remove : ‘ and ’ characters from the output
sed -r -i 's/://' NFS_stales.txt && sed -r -i 's/‘//' NFS_stales.txt && sed -r -i 's/’//' NFS_stales.txt

# Not used: replace space by a new line
# stales=`cat NFS_stales.txt && sed -r -i ':a;N;$!ba;s/ /\n /g' NFS_stales.txt`

# read NFS_stales.txt output file line by line then unmount stale by stale.
#    IFS='' (or IFS=) prevents leading/trailing whitespace from being trimmed.
#    -r prevents backslash escapes from being interpreted.
#    || [[ -n $line ]] prevents the last line from being ignored if it doesn't end with a \n (since read returns a non-zero exit code when it encounters EOF).

while IFS='' read -r line || [[ -n "$line" ]]; do
    echo "Unmounting due to NFS Stale file handle: $line"
    umount -fl $line
done < "NFS_stales.txt"
#EOF

2

在NFS服务器上,UN导出并重新导出文件系统:

exportfs -u nfs服务器:/ file_system exportfs nfs服务器:/ file_system

在客户端上挂载文件系统

挂载-t nfs nfs服务器:/文件系统/ mount_point


0

检查特定路径的lsof并杀死各自的pid。然后卸载该分区,然后将其重新安装。


这更像是一种解决方法,而不是问题中所述问题的解决方案。
asdmin
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.