您最有用/最有价值的Nagios插件是什么?[关闭]


33

我们正在扩展Nagios 3设置,并且经常遇到新的NRPE或常规的Nagios插件来测试我们现有的基础架构。虽然这是点点滴滴-以获得Nagios用户最看重的插件的摘要将很有用。

请在每个帖子中列出一个插件,最好简短说明您为什么喜欢它,并提供指向MonitoringExchange或插件开发者网站的链接。人们可以通过这种方式为已经列出的插件投票,我们可以按优先顺序查看它们。

出于相同的原因,最好不要列出其他人已经提到的插件。如果您要为其他人列出的插件添加更多信息,请对他们的回答发表评论。

谢谢!

Answers:


8

在灵活性方面,您无法击败snmp插件。它几乎在我运行的所有检查之后,如果不是,则表明TCP连接有效。


snmp check对于现阶段的最爱来说非常不错Matt(及其他:)-您有什么特别的技巧可以利用吗?我目前使用net-snmpd的主要要点是“新”扩展而不是执行功能的复杂性-check_snmpd处理得很好吗?
Mike Pountney,2009年

7

我们最有用的插件是测试我们更高应用程序功能的插件。例如,我们有尝试登录到网站的测试,以及尝试发送电子邮件并选中pop3邮箱以确保其到达的测试。如果其中任何一个发生故障,那么我们可以使用较低级别的检查来找出问题所在。pop3死了吗?MTA,MDA?数据库服务器?数据存储区?


Wotcha Dave;)您对如何连接上层和下层检查有任何提示?例如,如何在发送电子邮件与选中pop3框以查看它之间存在依赖关系?是否可以仅通过Nagios做到这一点,还是您使用自己的逻辑?
Mike Pountney 2009年

你真的在凌晨4点起床吗?:) Nagios具有服务依赖性,因此您可以使电子邮件检查取决于smtp,MDA和POP3检查,但这仅意味着电子邮件检查不会警告任何较低级别的检查。如果您有一组提供服务的服务器,则Thi会变得更加困难,因为nagios没有办法说“如果所有这些服务都已失效,请不要提醒我们该服务”。通常,我们仅依靠了解系统如何组合在一起来了解问题所在。
David Pashley 2009年

7

老实说,为我做得最多的人已经老了check_disk。没有什么让我感到特别与众不同,以那种“停止吃糊”的方式,就像昨天运行正常的服务器爆炸,疯狂地运行然后发现这是因为我让磁盘装满了一样。一生中再也不必这样做对我来说非常有价值。

(也不要忘了检查孩子在家看inode的情况。)


7

如果您想超越check_http功能,WebInject对于监视网站非常有用。它可以处理登录页面并在一次Nagios检查中执行多个步骤。


4

我发现check_nfsmount在许多服务器上都很有用。

编辑:如果我让代表这样做,我也会投票给check_snmp。它在我所有的服务器上都在使用,再加上我在所有HP打印机上运行的check_hpjd背后的逻辑。


4

我最有用的是我自己写的一个,用于检查Web服务器上的SSL证书,以便随时关注到期时间。


它张贴在任何地方吗?
2009年

4
check_http -H www.verisign.com -C 14
wittwerch,2009年

4

PNP(pnp4nagios.org)-为任何输出perf的Nagios检查生成RRD样式图。数据。非常有用,尤其是在试图说服开发人员说新安装的服务确实是所有这些CPU高峰的原因时……


3

通过check_nt(与NSClient进行对话或类似的话题),您可以在Windows框上查询WMI-如果有性能计数器,则可以使用Nagios对其进行监视。


您可以监视所有正在运行的服务,例如检查Exchange或sql服务器是否正在运行
Simon Foster 2009年


2

我同意check_snmp是一个非常有价值的插件;它几乎可以用于任何目的,一般来说,所有内容都显示在SNMP中。无需其他安装即可在HP-UX,Tru64和OpenVMS等各种系统上使用SNMP。

NagiosGrapher是另一个非常有用的插件(不是非常有用)。我在一篇文章中有自己的经验,该文章可以做更多解释,但也可以使其他人轻松使用它,而我没有遇到任何困难。

最后一个:NSCA。您可以编写Perl或Ruby或ksh脚本,然后将输出提供给NSCA。

在NSCA和SNMP的灵活性与NagiosGrapher的报告相结合之间,这将很好地扩展您的监视范围。


2

我喜欢用check_http来检查我的网站是否仍在工作,我将其扩展以检查在我的托管公司决定提供空白页并在服务器仍在运行时nagios检查所有通过之后是否可以在其中找到某些文本。


2

对我来说最有用的是我为自己的需求写的:nagios-check-webpage

它将下载带有js / css / images,带有多线程和gzip(节省很多带宽)的整个页面,就像真正的导航器一样。


+1的确,该插件很棒。将其用于应用程序。4个月了。
Henk

1

第一是NagiosWSC,它使您可以通过WMI对Windows主机进行无代理监视


无代理,但是只有一个大的单点故障,呃。
Toto

1

它检查实际延迟以拉起网站,并对其进行扫描以查找“ status:ok”隐藏标签。它捕获了我们的鱿鱼缓存问题和语言设置问题,该问题仅在每隔几个晚上的凌晨3点才发生一次,当时有人使用要求土耳其语国际化版本的浏览器访问该网站。

认真地,设置可能的每种监视类型。在良好的监控下,您可以在复杂的环境中捕获到奇怪的错误和错误,这真是令人惊讶。另外,将性能数据记录到rrd数据库中,并在Cacti中显示。


1

最重要的插件之一是我自己编写的插件:check_rdiff_backup。我在国外做备份,Nagios告诉我是否以及何时发生问题。

如果您正在寻找rdiff-backup插件,可以在Google上找到一个。


1
您知道一个用于rsnapshot的内容吗?
罗里

1

check_curl对我来说真是天赐之物。网站检查的灵活性确实有所不同,并且发现它比webinject容易得多,几乎具有我需要的所有功能


1

严格来说,它不是插件,但是让twurl(https://github.com/marcel/twurl)作为触发警报的一种手段绝对是天赐之物。无需SMS警报,而无所不包。

操作方法的详细信息:Nagios使用Twitter(带有twurl)警报而不是开火 -为无耻的自我提升道歉;)

其他事情...

Check_diskio(https://trac.id.ethz.ch/projects/nagios_plugins/wiki/check_diskio)与标准CPU负载和进程号检查结合在一起,在确定何时/是否绑定IO以及绑定方式方面非常有用。使用nagiosgraph(http://exchange.nagios.org/directory/Addons/Graphing-and-Trending/nagiosgraph/details)更加容易。





0

这是一种作弊,因为我已经做了很多开发工作,并且实际上一次检查了许多不同的东西,但是对我来说最有用的nagios“插件”是Resmon。它是您在服务器本身上运行的代理,并且nagios通过http连接以执行检查。我想这与nrpe的功能相似,但是有许多不同的设计决策。


0

我使用了两个插件..一个用于提供警报的XML提要,另一个用于通过Twitter发送警报。两者都很有用(除了常规插件外)。如果您将NRPE视为插件,则也要添加它。


0

check_apt真的很棒,它使我想起有关更新Debian服务器的信息。


0

最近,我开始使用check_multi插件,对大输出(由于HTML和性能信息)使用了修补/ 增强的NRPE
几乎是“一个插件来统治所有人”!;-)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.