Nagios绘图解决方案与Munin / Cacti / Ganglia


9

我有一个用于监视30台Windows服务器的nagios服务器设置。我想添加一些趋势图。我读过,nagios图形插件很简单,许多人使用单独的独立图表/趋势工具。

nagios图形插件相对于独立产品(例如ganglia / munin / cacti)的限制是什么?

我对独立软件包提供的特定功能和优点感兴趣,而nagios图形插件却没有。


您还应该考虑使用Zabbix ... serverfault.com/q/109595/2039
sebthebert 2011年

尝试基于nagios的opsview社区版。您可以安装不同的Linux版本或下载VM。opsview.com/downloads/download-opsview-community
Matias Dominoni'2

作为记录:我尝试了nagiosgraph,然后坚持使用它。我对它提供的功能感到非常满意
sumek 2011年

Answers:


7

考虑到您已经安装了nagios,请考虑使用nagiosgraph或pnp4nagios。

nagiosgraph和pnp4nagios在绘制nagios性能数据方面做得很好。nagiosgraph具有基于参数的配置方法,pnp4nagios具有基于模板的方法。

  • 每当nagios配置更改时,两者都会自动检测新的主机/服务
  • 两者都进行图形缩放
  • 当您将鼠标悬停在特定主机/服务上时,它们都提供图形
  • 两者都提供了许多方法来对数据进行切片和切块
  • 都可以检测并绘制出您已在nagios中定义的严重和警告级别的图形
  • 两者都可以直接嵌入到nagios框架中,以实现从当前状态到历史记录以及返回的无缝,整洁的导航

将数据切片和切块非常重要,恕我直言。例如,您可以查看单个主机上的所有服务,或查看具有特定服务的所有主机,或查看任意主机和服务的图形的任意集合。

安装并非易事,但并不困难。在很大程度上取决于您要定制多少东西。例如,nagiosgraph是“ install.pl”或“ rpm -i nagiosgraph.rpm”或“ dpkg -i nagiosgraph.deb”。pnp4nagios是'./configure; 使; 进行安装”。

n2rrd也可以做一些这样的事情,但是它还不够完善,需要更多的工作来配置。

rrdtool具有wrt数据存储功能,任何系统都会有采样问题。rrdtool默认情况下会进行一些数据平滑处理,但是如果需要,您可以捕获(和绘制图形)除平均值以外的最大值和/或最小值。

由于每个rrd文件中的架构都是静态的,并且大多数系统都使用rrd文件名来标识数据,因此每种基于rrdtool的方法都存在数据/图形陈旧的问题。当主机名或服务名称更改时,数据通常不会丢失;rrd文件仍然存在于磁盘上。但是某些用户界面提供了查看“过时的” rrd文件的方法,其他用户界面则需要通过命令行进行手动整理。在许多安装中,这仅是最初配置系统时的一个问题,但是在动态环境中(例如,监视寿命只有几个月的虚拟机),这可能会变得乏味。

最后一点。趋势实际上有两个部分:数据收集和数据显示。如果使用独立的图形系统而不是扩展现有的nagios安装,则可能必须在Windows计算机上安装其他组件才能收集数据。


13

我同意lynxman。NAGIOS用于即时定性数据(X可以吗?);munin用于历史定量数据(X现已满,今年已满?)。我所有的NAGIOS安装(其中一些监视数百项服务)都与munin系统链接以进行定量监视。

还要注意,munin具有用于将数据馈入NAGIOS的特定挂钩。它了解“警告”和“临界”阈值的概念,并且在需要通知(以及需要对NAGIOS“大板”的看法)的地方,使用单个munin变量通知单个NAGIOS服务的状态非常容易。

通常的工作流程是,在NAGIOS发出警报已超过阈值之前,没有人会查看munin图,但是随后munin图对于发现某个事物是否随着时间的推移逐渐缓慢上升或变得不合时宜而变得无价。 -蓝色增加,或者我们有一个每周的上下周期,其幅度在缓慢地增加,或者在增加。

正如lynxman所说,UNIX方式是“一项任务,一项工具”。制作munin和NAGIOS的工具链非常适合我进行定量和定性监控以及通知。它也有保持清洁接口的独特的优势:当你看NAGIOS,你看怎么好东西都工作的一个简单的观点,现在,没有历史数据弄乱视图。当您查看munin时,您会看到与该问题有关的历史信息,可以进行分析,而不会出现“主机故障”或“ sshd无法与我交谈”的错误,使视图混乱。


3

就像您说的那样,Nagios图形插件非常受限制,它们提供了非常基本的rrdtool界面,并且UI设计有点反直觉,这基本上是对nagios的破解,试图只是出于娱乐目的而使用它,但它多次破裂而没有发出警告。

选择独立的产品(尤其是munin或ganglia)会为您提供nagios无法完成的一系列服务,因为unix的口头禅是,擅长于一件事胜过尝试擅长于许多事情,nagios对于监视和munin /神经节/仙人掌在绘制图形时非常出色。


那么,nagios无法完成的大量服务又有什么呢?这是我感兴趣的
sumek

使用nagios,很容易丢失图形数据,插件也很容易在任何给定时间停止图形数据,它没有给您放大特定时间的可能性(其他所有方法都可以做到),并没有给您创建复杂的聚合图的可能性,而这只是针对
入门

轻松松散图形数据是什么意思?一个快速的谷歌显示所有提到的5个解决方案(神经节,穆宁,仙人掌,pnpgraph,nagiosgraph)都使用rrdtool来存储图形数据。
sumek 2011年

是的sumek,我的意思是,nagios上的绘图工具再次是一个黑客,只要rrd文件名和图形信息不匹配,它就会中断,如果您想尝试的话,我会很痛苦做到了,然后再转向真正的解决方案,例如munin :)
lynxman 2011年

2

在Stack Overflow中,我们使用n2rrd(它是Nagios插件)来绘制性能数据图。在某种程度上,我会同意lynxman的观点,即它确实具有很大的黑变感觉。

然而:

  • 使用n2rrd,您可以让Cacti根据数据进行绘图,而不是n2rrd随附的rrd2graph.cgi
  • 带有rrd2graph.cgi的n2rrd确实支持缩放
  • 至于复杂的聚合图-您基本上可以手动操作rrd图,并可以对它们执行任何操作。

rrd图形是根据服务器名称存储的,因此,如果更改名称,则会丢失数据...虽然总可以重命名文件,但它们是符号链接的文件,并且不会丢失数据。

我最近在《一些更好的RRD Graphs Server Fault博客的一些技巧》一文中提供了这些图形的一些示例。另外,n2rrd页面包括仙人掌演示以及rrd2graph。

我认为最重要的是,走Nagios路线可能缺少一两个功能,但是如果您不介意亲自编写rrd模板的细节,那是相当完整的*。这可能会花费您更多的时间,但会鼓励您在rrd方面发展更多的专业知识。


1
* [未引用的脚注错误]:凯尔,您要在此处添加什么?询问者需要知道!
MadHatter

0

我需要准确的数据,而rrd的数据显示不准确-已标准化!对于大多数用户而言,这很好,因为他们一开始并不使用非常准确的数据。他们使用的数据采样率通常在一分钟或更长时间,而这并不能为您提供正在发生的情况的非常准确的描述。这也意味着,如果某个地方的数据高峰,您可能永远都看不到它。

考虑一下-假设您的Gb网络以大约10MB /秒的速度嗡嗡作响,突然间,在几分钟内突然出现100MB /秒的峰值。还要注意,如果只是30秒的峰值,那么在几分钟的采样率下您甚至可能看不到它。如果查看当天的数据,则“峰值”可能仅以15MB /秒的速度显示,尽管实际值还取决于许多其他因素。您还很有可能会认为网络不愉快时您会感到高兴!

令我更沮丧的是将数据标准化为图形的物理宽度和x轴范围。这意味着我提到您没有看到的峰值吗?如果放大,就会神奇地出现!我会坚持使用gnuplot-图形可能不那么漂亮,但它们坚如磐石,并且gnuplot永远不会在显示数据之前修改数据。

-标记


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.