监视生产服务器[关闭]


18

我们有3个专用服务器,使用openVZ分为多个VPS。我们正在使用munin监视生产站点上的VPS,并监视其中一个VPS,以确保其在出现故障时重新启动服务。

事情是,我们需要一种更好的方法来监视所有服务器,因为我们拥有多达14个VPS,因此我们希望有一个中心集线器,不仅可以看到munin收集的数据,而且还可以看到其他一些统计信息在我们服务的网络和性能上。

我们的一些要求:
-有关失败的SMS通知(能够设置某些自定义验证)
-apache error_log等的日志分析器。
-必须位于中央(意味着一台服务器和多个节点收集数据)。
-不需要易于安装但易于维护。
-需要免费

我一直指着nagios和splunk,您怎么看?谢谢,

Answers:


17

我有一个类似的设置,除了安装了Xen。我对以下组合感到非常满意:

  • Nagios发出警报(使用PNP进行某些精简制图,使用Nagviz进行服务状态仪表板)
  • 用于系统历史记录的神经节
  • OSSEC作为HIDS,并且作为集中式日志记录的收集器同样重要
    • 旁注:有Splunk的插件OSSEC,集成这两个工具非常好,我在等待他们将它移植到Splunk的V4虽然。
  • Splunk最后,一旦迁移了一些Splunk插件,我们计划使用Splunk并对其日志进行一些预过滤(以免超出免费版上限)

我希望共享我们的监视设置将对您有所帮助:-)

以下是一些有用的链接:

http://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-1/index.html

https://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-2/

http://www.ossec.net/main/splunk-ossec-integration

更新:

我忘了提一下,我们也使用Matt Simmons Nagios配置布局,请参见http://www.standalone-sysadmin.com/blog/2009/07/nagios-config/

这种布局使我们的Nagios Configuration更加合理,而且易于维护(感谢Matt!)


2
对于OSSEC + splunk +1。他们在一起工作得很好。
sucuri

5

我在Zabbix上取得了巨大的成功,它在一个软件包中满足了您的所有要求。

替代文字
(来源:zabbix.com

最困难的部分将是获取Apache日志监视,但是Zabbix是可扩展的,因此您可以使用LogWatch或其他一些perl脚本来为您获取数据。


2

我喜欢OpManager,它可以释放一定数量的节点。完成上述所有操作,并且非常容易安装和维护。


1

Nagios应该是一个不错的选择。首先-它是模块化的,几乎可以满足您的所有期望。此外,它还获得了一些不错的奖项

编辑:不要忘记检查此答案

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.