Nagios在WAN上进行“监视”是否理想?


8

刚从一家新公司起步,我的第一个任务就是寻找内部监控系统的替代方案。

他们当前的解决方案是.Net应用程序,它可以检查WAN上的各种设备(因为它们是提供24/7支持/“维护”的IT咨询公司)。设备范围从路由器/交换机/打印机到MS服务器和服务。

在阅读了网站上无数的帖子并进行了广泛的搜索之后,似乎已经达成共识,那就是要使用某种Nagios / Munin混合。

这使我想到了一个问题:

A)是否可以在公司本地运行Nagios服务器并通过WAN监视各种外部站点?(他们不希望在每个站点上都使用本地Nagios服务器,因为大多数站点相对较小(10-25个主机),站点数量也很大(75-100个))。

B)如果是,代理商将如何联系Nagios后端?通过SSH?HTTP?

C)除了容易受到WAN链接故障的影响外,这种解决方案的直接缺点是什么?

感谢您提供任何反馈意见,对于任何误解,我都表示歉意,因为这对行业来说是相当陌生的。

Answers:


6

可以通过WAN进行监视,但通常并不理想。这是因为,如果WAN链接断开或闪烁,所有检查将失败,并且您看不到远程位置的情况。您还增加了延迟,使其对LAN View性能测量的用处不大。话虽这么说,如果您采用这种方式,则可能要设置依赖项,以便在WAN链接出现问题时不会收到警报。

我看到监视系统与其监视的服务之间进行通信的最常见方法是拥有站点到站点的VPN隧道。这样,通信与本地网络没有什么不同。另外,Nagios通常基于Pull(尽管不一定)。因此,Nagios与其联系监视的服务和服务器,而不是相反。

最后,更理想的解决方案是使用分布式监视设置,Nagios的一个选项在http://nagios.sourceforge.net/docs/3_0/distributed.html中进行了描述。


绝对是运行本地服务器的一种情况,并且对NRPE确实有很长的眼光。至于协议?这取决于您-可能应该确保安全,但是有ssh,
隧道

非常感谢,分布式文章中的一些重要信息将派上用场。
NmE 2012年

1

这取决于您要在WAN上监视的内容。在大多数情况下,如果您仅执行ping检查,服务检查,磁盘检查等,并坚持使用nagios的默认5分钟检查时间,我看不到它会导致您遇到问题。

同样,根据您要检查的内容而定,取决于要讨论的内容。如果要检查Windows主机,则可以只使用WMI查询,甚至不需要在该框中运行代理。


1

当然,可以通过几种不同的方法来实现。

如果无法使用“分布式设置”,则需要至少执行以下一项操作:

  1. 让远程站点上的每个框将检查结果推送到Nagios(请参阅NSCA
  2. 戳防火墙漏洞,以便Nagios可以到达每个远程站点的每个盒子
  3. 在每个站点上指定一个框作为“ Nagios代理”

我建议使用#3,因为它需要最少的防火墙漏洞,并且可以简化配置。它有点像分布式安装的精简版,因为它不需要每个站点都有完整的Nagios实例。

为此,您可以设置NRPE(或使用check_by_ssh),并使此“代理”对网络上的其他主机运行所有其他检查。这带来了额外的好处,即您获得的性能数据是相对于代理而言的,因此不会受到WAN延迟的影响。

此外,您还可以使用父/子设置将远程站点上的每个主机作为其代理的子代,以减少错误肯定的通知。您可能还希望使所有服务都依赖于代理的check_nrpe(或check_ssh)服务。有关更多信息,请参见网络可达性文档。

无论采用哪种方法,都必须适当地调整默认超时,以解决遍历WAN链接的额外延迟,这一点非常重要。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.