机器:Dell r815,CentOS 5.4、256GB RAM,4 x 12核。
我们有一个具有275GB文件的应用程序。它一次对20GB的数据进行就地排序,即它交换位并替换为同一文件。这一切都很好。
最后一步是读取整个文件,并对不同的20GB块进行合并排序,然后将它们输出到一个新文件中。
这个过程可以运行一段时间,最终将大约50GB刷新到磁盘。此后的某个时间,WHOLE机器开始崩溃。
简单的命令一样ps -ef
,ls -al
,挂了很长一段时间,并显示为以100%的CPU(这只是一个核心)。
查看上的内存统计信息top
,我看到它正在使用大约120GB的RAM(因此128GB可用),并且在“缓存”部分下有120GB。
以前有没有人见过这种行为?在具有64GB内存的计算机上,相同的过程运行良好-因此,我认为这与计算机中具有的RAM装载有关。
(正如我们所说的,我正在除64GB之外的所有计算机上运行测试,以排除硬件问题)。
我也许会缺少一些vm参数/etc/sysctrl.conf
吗?
谢谢!