nagios服务器上的高负载— nagios服务器要进行多少次服务检查?


9

我有一台运行Ubuntu的nagios服务器,该处理器具有2.0 GHz英特尔处理器,RAID10阵列和400 MB RAM。它监视8个主机上的总共42个服务,大多数服务使用check_http插件进行检查,甚至5分钟,每分钟检查一次。最近,nagios服务器上的负载已超过4,通常高达6。该服务器还运行仙人掌,每分钟收集6台主机的统计信息。

我想知道,这样的硬件应该能够处理多少种服务?是因为我不断提高硬件的限制而导致负载如此之高,还是该硬件应该能够处理42个服务检查以及仙人掌?如果硬件不足,我应该添加更多的RAM,更多的内核还是更快的内核?其他人正在运行哪些硬件/服务检查?


现在服务器上的ram使用情况是什么样的?另外,CPU的使用情况如何?如果那是很高的话,什么程序挂了呢?
3dinfluence 2010年

您解决问题了吗?我们遇到了同样的问题。平均负载为12。-
约翰·约翰·

Answers:


7

您需要找出瓶颈所在...

我运行了一个nagios监视器,该监视器使用http,ping和ssh检查来检查400多个主机。(以及许多其他被动检查和nscd)

这是在RAID10中带有4个SAS磁盘的2xQuadCore服务器上。

我怀疑您在进行IO争用,因为写入大量rrds的效率很低。

您需要确定哪个进程占用了您的资源。(仙人掌,nagios或其他)

对于IO检查,我喜欢iotop。安装iotop(9.04软件包可在8.04上运行)

但是除此之外,top还应该帮助您找到负载猪。

仙人掌每分钟一次非常激进。(我以5m的间隔跑我的)

我听说过的rrd写争用的一种方法是将rrd存储放在ramdisk / tmpfs上。(确保不时地将其同步到持久性存储)

祝好运。


谢谢。我会调查一下。可能是仙人掌在产生负载,我将看看是否有办法将rrds移至tmpfs。或者只是添加更多的RAM,以便服务器可以缓冲rrds。我担心如果我每5分钟运行一次仙人掌,负载峰值只会持续1或2分钟,而我会完全错过...
乔什(Josh)2010年

6

除非仙人掌产生大部分负载,否则您应该能够运行比硬件上更多的检查。

我在运行速度缓慢的旧PC(奔腾3 1GHz的PATA磁盘速度慢)上的Microsoft Virtual Server上运行的FreeBSD虚拟机上运行nagios。该虚拟机只有128MB RAM,性能非常糟糕。

但是,平均负载约为0.2,在42台主机上运行158次检查。


谢谢。我希望我能接受两个答案!您非常有帮助,这向我表明仙人掌可能是罪魁祸首。
乔什(Josh)2010年

2

在具有256MB RAM的旧PIII上,我正在主动监视大约230种不同的服务。同一台机器还为我们所有传入的传真运行MRTG和HylaFAX,并且运行起来非常舒适。


非常有用的信息。这向我表明,仙人掌可能是罪魁祸首,而不是nagios。谢谢!
乔什(Josh)2010年

1

您应该能够使用该硬件运行大量的nagios检查。我们使用约70个支票和Nagiosgraph运行类似的设置-主要区别在于增加了RAM(它很便宜,因此我将其增加到2Gb)。

尝试运行top或ps -aux来查看CPU是否过载,但是我对此表示怀疑。您可能还需要检查nagios 并行化文档,以查看您的安装是否尝试一次运行太多检查而不是序列化它们。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.