我有一台具有94.6GiB RAM的24核计算机,该计算机运行Ubuntu服务器10.04。与其他服务器(具有4个内核)运行相同类型和数量的进程的服务器不同,此设备正在经历较高的%iowait。两台计算机均通过4个FC卡连接到VNX Raid文件服务器,24核计算机,另一台通过2 GB以太网卡连接。4核计算机当前优于24核计算机,具有更高的CPU使用率和更低的iowait。
在9天的正常运行时间中,%iowait平均为16%,通常超过30%。大多数时候,CPU使用率非常低,大约为5%(由于较高的iowait)。有足够的可用内存。
我不明白的一件事是,为什么所有数据似乎都通过设备sdc而不是直接通过数据移动器:
avg-cpu: %user %nice %system %iowait %steal %idle
6.11 0.39 0.75 16.01 0.00 76.74
Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
sda 0.00 0.00 0.00 1232 0
sdb 0.00 0.00 0.00 2960 0
sdc 1.53 43.71 44.54 36726612 37425026
dm-0 0.43 27.69 0.32 23269498 268696
dm-1 1.00 1.86 7.74 1566234 6500432
dm-2 0.96 1.72 5.97 1442482 5014376
dm-3 0.49 9.57 0.18 8040490 153272
dm-4 0.00 0.00 0.00 1794 24
dm-5 0.00 0.00 0.00 296 0
另一个难题是任务经常进入不可中断的睡眠模式(在顶部),这也可能是由于io延迟。
我可以看些什么来帮助诊断问题?为什么所有数据都通过/ dev / sdc?那正常吗?
更新:
网络连接和VNX读/写容量已被排除为瓶颈。使用4个绑定的NIC(轮询),我们可以达到800MB / s的速度。光纤通道卡尚未使用。VNX能够很好地处理IO(RAID6,两个池中每个池30x2TB 7.2kRPM磁盘(总共60个磁盘),大约60%读取)。
忽略dm和sdc,它们都是内部磁盘,而不是问题的一部分。
我们认为问题可能出在nfs挂载或TCP(在VNX上有5个挂载到5个分区),但不知道到底是什么。有什么建议吗?
dm
代表设备映射器,而不是数据移动器。这个问题在Server Fault上可能会做得更好。