Answers:
我们最有用的插件是测试我们更高应用程序功能的插件。例如,我们有尝试登录到网站的测试,以及尝试发送电子邮件并选中pop3邮箱以确保其到达的测试。如果其中任何一个发生故障,那么我们可以使用较低级别的检查来找出问题所在。pop3死了吗?MTA,MDA?数据库服务器?数据存储区?
如果您想超越check_http功能,WebInject对于监视网站非常有用。它可以处理登录页面并在一次Nagios检查中执行多个步骤。
我发现check_nfsmount在许多服务器上都很有用。
编辑:如果我让代表这样做,我也会投票给check_snmp。它在我所有的服务器上都在使用,再加上我在所有HP打印机上运行的check_hpjd背后的逻辑。
我最有用的是我自己写的一个,用于检查Web服务器上的SSL证书,以便随时关注到期时间。
通过check_nt(与NSClient进行对话或类似的话题),您可以在Windows框上查询WMI-如果有性能计数器,则可以使用Nagios对其进行监视。
这有点无耻,但是如果您正在使用NRPE监视Windows计算机,NagiosPluginsNT似乎可以很好地工作。;-)
对我来说最有用的是我为自己的需求写的:nagios-check-webpage
它将下载带有js / css / images,带有多线程和gzip(节省很多带宽)的整个页面,就像真正的导航器一样。
严格来说,它不是插件,但是让twurl(https://github.com/marcel/twurl)作为触发警报的一种手段绝对是天赐之物。无需SMS警报,而无所不包。
操作方法的详细信息:Nagios使用Twitter(带有twurl)警报而不是开火 -为无耻的自我提升道歉;)
其他事情...
Check_diskio(https://trac.id.ethz.ch/projects/nagios_plugins/wiki/check_diskio)与标准CPU负载和进程号检查结合在一起,在确定何时/是否绑定IO以及绑定方式方面非常有用。使用nagiosgraph(http://exchange.nagios.org/directory/Addons/Graphing-and-Trending/nagiosgraph/details)更加容易。
好吧,简单,简单和默认的文件-check_disk,check_load,check_http对于大多数情况已经足够完美(大多数情况下,我们想知道服务器,网站是否已启动并正在运行)
除了check_disk和check_swap之外,还有一个check_memory http://exchange.nagios.org/directory/Plugins/Uncategorized/Operating-Systems/Linux/check_memory/details 提供内存使用情况...
与check_nrpe 链接文本一起使用的check_multiprocs
我使用了两个插件..一个用于提供警报的XML提要,另一个用于通过Twitter发送警报。两者都很有用(除了常规插件外)。如果您将NRPE视为插件,则也要添加它。
最近,我开始使用check_multi插件,对大输出(由于HTML和性能信息)使用了修补/ 增强的NRPE。
几乎是“一个插件来统治所有人”!;-)