我如何安全地摆脱这种情况?
详细信息如下:
Xen服务器已将块设备分配给VM。但是这些设备也已安装在Xen内部。
实际上,这些块设备中的44个已像这样安装。更糟的是,每个物理设备在4条路径上可见,并且每个都安装在单独的安装点上。换句话说,设备实际上每个安装5次。
VM guest虚拟机操作系统通过PowerPath伪设备(作为phy:块设备分配到domU)查看路径。
一些设备被格式化为ext2和reiserfs。
无需向我解释此处涉及的文件系统损坏风险。
恐怕即使只是卸载文件系统也可能导致损坏,并且在这一点上,从主机上拉电是最安全的选择。
请注意,所有VM中的应用程序(大部分是Oracle数据库)仍在运行和使用中。
我在调查dom0上的高CPU使用率时发现了这一点。cwd-> / media / disk-12是从/ dev / sdf1挂载的,它属于/ dev / emcpowerr,这是一个无法杀死的“查找”进程
在有人问之前,有一次我看到进程无法杀死并继续使用CPU和RAM(不像已失效/僵尸进程),那是当有未完成的I / O提交时,例如返回了同步但还没有物理上在磁盘上。更常见的是,这发生在磁带I / O上。
建议!?
PS我希望安装后可以“保留”设备,以防止发生这种情况?还是在Linux上不可能?
编辑:首先,我确信管理程序内的KDE是元凶。看起来KDE正在安装可以在日志记录中创建桌面图标的设备。但是,在其他Xen服务器上不会发生相同的事情,但是所有其他服务器都运行的是SLES和KDE的较旧版本。V4似乎是令人讨厌的版本,行为3.4更好。
此外,两个非关键VM已挂起。关闭它们后,由于文件系统损坏,它们将无法再次启动。主/生产VM仍在运行,并且其上的数据库仍在运行,但这显然是定时炸弹。客户正在尝试在另一台服务器上的另一台VM上重建环境,但是在配置某些组件时遇到了问题,因此我们正在等待...
无论如何,我觉得到目前为止,答案都还不只是“最佳实践总是正常关闭”,而且我希望得到一些更具体的信息……无论如何,我认为这种情况可能需要更加谨慎思维。关闭会导致未完成的IO(尤其是来自虚拟机管理程序的文件系统元数据更新)同步并可能导致主要的文件系统损坏吗?