Answers:
您可以使用LogWatch之类的东西。甚至是一个像这样的简单脚本(您需要为您的环境修改它的伪代码):
#!/bin/bash
GREP_STRING=`grep -c <error string> <acpid log location>`
if [ $GREP_STRING -ne 0 ]
then
<send email notification>
fi
将其放在cron中,使其每小时运行约一小时,您应该收到一封电子邮件,让您知道它何时变得很奇怪。
您可以使用OSSEC HIDS在日志文件上设置规则,并同时从主机获取安全信息。
设置起来非常简单:
/var/ossec/rules/local_rules.xml
按照以下指定进行编辑/var/ossec/bin/ossec-control start
local_rules.xml
<group name="local,syslog,">
<rule id="100001" level="13">
<regex>^.*Your string.*$</regex>
<description>I've just picked up a fault in the AE35 unit. It's going to go 100% failure in 72 hours</description>
</rule>
</group>
规则可以非常灵活和复杂。请参阅此表以了解规则中涉及的参数。
如果您不需要或不需要其他安全功能,可以通过删除标记include
下的行来停用它们rules
。
我会建议Nagios它在监视网络中的多台机器上的运行方式。非常好,我没有将它专门用于您的工作,但是您可以将其设置为在发生错误时通过电子邮件发送给您。
这里有一个在Ubuntu http://beginlinux.com/blog/2008/11/install-nagios-3-on-ubuntu-810/上安装它的指南,还有一个在http://www.debianhelp上安装它的指南。 co.uk/nagiosinstall.htm。
在服务器上下载并安装Splunk。它类似于logwatch,但是为您的日志提供了搜索引擎。
您可以对其进行配置以对日志建立索引,然后可以搜索日志并查找模式,查找错误,然后查看在该特定故障点上其他日志在做什么。
还可以将其设置为在特定阈值下发送警报或执行脚本。因此,如果特定错误开始被发送到您的日志中,则可以对其编写脚本以自动重新启动有问题的服务。
我们在服务器群集中使用了splunk,这真是救命稻草!
在以前的雇主那里,我们使用了logsurfer +来实时监视日志并发送电子邮件警报。确实需要花费大量时间和配置来调整误报,但是我们有一个规则集可以很好地适用于各种发现和警报,比起类似的目的,Nagios的价值要高得多。
不幸的是,我再也无法访问配置文件来提供我们过滤的样本,但是该站点应该提供更多信息和示例。