我使用的是相当大的nagios配置(约4000个服务),没有任何依赖关系。当出现问题时,这会导致大量的通知混乱。
我试图通过Nagios Dependencies寻找最佳实践,但是我在网上发现的只是一个简单的例子而已。我需要的是更深入的信息,以及有关如何管理此类配置文件的最佳实践。
示例:在包含100个服务器且每个服务器都监听apache的群集上,我正在监视apache进程和监听TCP端口80的数量。我想使一个依赖于另一个,但是dependent_hostgroup_name不能解决问题导致所有“检查过程”服务都依赖于每个“ check_http”服务。
问题是:如何管理依赖性?您是否使用脚本来生成它们?
1
这家伙有同样的问题:dimmeria.com/node/1804 我看来,脚本/模板是唯一的办法:(我希望有人做了我面前,所以我不会有。
—
法尔肯