我需要用更具可扩展性的东西来代替穆宁[关闭]


8

我已经在多个服务器上使用munin多年,并取得了巨大的成功,但是在munin节点超过100个的情况下,当客户端上有负载时,处理就会超时。

我对cron作业和客户端进程数进行了一些缩放更改,并减少了运行的插件数,等等。但是我决定寻找一种具有更可扩展的体系结构的替代方案。

任何建议或经验都将受到欢迎。我基本上对服务器度量标准感兴趣,该度量标准可用于容量规划和诊断资源使用情况。(我们有nagios提醒)


Answers:


8

听起来您可能有两个问题

  1. 在监视服务器上,记录许多服务器的指标所需的随机I / O数比存储所能提供的更多。即使所有指标都已写入磁盘,服务器也可能过载,无法从中实际生成图形。
  2. 在受监视的客户端上,收集指标的插件占用过多的CPU和内存,并且在客户端承受重负载时无法及时收集数据。

我过去曾使用Munin,但目前正在使用collectd。Collected的作者为解决这些问题投入了大量的思想和精力。他们拥有一个精心设计的系统,可将数据写入RRD文件,以确保您不会丢失数据并生成最新的图形。还支持RRDCacheD。守护程序和官方插件都是用C编写的,因此它们只占用很少的内存或CPU时间。在我的客户端系统上,它每分钟仅使用不到2MB的RAM和大约四分之一秒的CPU时间。在我的监视服务器上,它每分钟使用20MB的RAM和三分之二秒的CPU时间。请记住,我的所有指标每隔十秒就会收集并发送到我的监视服务器,而不是像munin那样每隔几分钟就发送一次。


2
munin现在对rrdcached具有初步支持。与默认安装相比,它需要一些额外的工作。这不是对munin / collection的赞成或反对的投票,我仅添加此内容是为了帮助任何人在为munin设置而苦苦挣扎且没有改变系统的余地。
dfc

3

尽管它们是很棒的工具,但Munin和其他RRDTool前端(例如Cacti或Ganglia)已经知道了I / O问题,并且在监视节点的成千上万时很难扩展。

虽然有一些技术可以解决此I / O瓶颈。这些技术之一是将写入分散在大量磁盘上,以减少每个磁盘中的I / O。另一方面,许多系统管理员使用tmpfs文件系统来解决此问题。RRDCached也是处理此问题的最新且不错的选择,我建议您看一下这张幻灯片

我对Munin不太熟悉,但是Cacti有一个Boost插件。该插件将数据缓存在内存中,并执行对磁盘的海量和按需更新,而不是单个写入,从而减少了I / O。我很确定Munin也有这样的东西。

如果您负担得起,SSD磁盘也是不错的选择。

最后但并非最不重要的一点是,您还可以查看Reconnoiter。Recconoiter是一种全新的故障检测和图形/趋势工具。与大多数趋势工具不同,Reconnoiter不是基于RRDTool的,而是试图解决此特定问题。我没有在生产中使用Reconnoiter,但是我进行了一些测试,尽管仍然有些“绿色”,但看起来确实很有希望,尤其是在可伸缩性方面。

希望这可以帮助!


Zabbix也不使用RRD,它使用MySQL或Postgres之类的后端。如果模板正确,并且不监视无用的内容,则可以轻松扩展。
coredump

2

查看Zabbix。它是目前最好的开源性能监视工具之一。它可以很好地扩展,并且已经在具有数千台计算机的环境中使用。


0

Marco Ramos提供了一些可靠的建议。但是,我想补充说明:munin的最大问题是固定5分钟的收集时间表。如果在5分钟内所有节点均未返回结果,则您开始出现辍学现象。这是穆宁最大的问题。

诸如Ganglia之类的其他基于rrdtool的工具并未锁定在同一5分钟的更新窗口中,因为它们不会以与munin相同的顺序方式轮询所有数据源。

我建议您看一下Ganglia,因为它通常可以很好地扩展(尽管对于大型的ganglia安装,您确实需要关闭多播数据收集)。我怀疑在开始担心rrdtool是瓶颈之前,您可以在神经节上走很长一段路。到那时,您可以执行Marco建议的各种操作,例如使用SSD驱动器。


确实,您是对的,仙人掌也是如此。
Marco Ramos

0

我要替换带有Ganglia的Munin,Munin杀死了我的服务器,所以我将尝试一下Ganglia,看看它如何扩展。


怎么样了 我本人对这样的替换感兴趣...
thanasisk 2014年

我更喜欢Munin的图,但Ganglia的效果很好。此后我离开了工作,但是当我离开时,我确实用Ganglia取代了Munin。在Munin的最新版本中,我倾向于认为他们调整了内存使用率。我会毫不犹豫地使用任何一个,我想这是一个偏好问题。
luckytaxi 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.