我需要从Java应用程序(log4j)监视一些大噪音日志文件(每天500m)。现在,我手动查看文件,grep表示“ ERROR”,依此类推。但是,工具应该有可能发现文件中的重复模式,对它们进行计数并提供对各个条目详细信息的深入分析。有人知道这样的工具吗?基于文本或Web的UI会很好。
我需要从Java应用程序(log4j)监视一些大噪音日志文件(每天500m)。现在,我手动查看文件,grep表示“ ERROR”,依此类推。但是,工具应该有可能发现文件中的重复模式,对它们进行计数并提供对各个条目详细信息的深入分析。有人知道这样的工具吗?基于文本或Web的UI会很好。
Answers:
我听说有人在日志文件上应用贝叶斯过滤以发现有趣的内容而不是常规的日志条目。他们使用了垃圾邮件过滤器,常规的无趣条目被认为是“垃圾邮件”,而不寻常的条目被认为是“垃圾邮件”,并使用这种颜色可以转移。
在我看来,这听起来很像机器学习的东西,但是我再也没有看到它的实际应用,只是通过啤酒听到了它。
在查看syslog-ng和patterndb(上述答案的+1)时,我遇到了一个名为ELSA的基于Web的工具:http : //code.google.com/p/enterprise-log-search-and-archive/。它是perl中的F / OSS,具有Web界面,而且应该非常快。
我还没有尝试过,但是一旦使用patterndb完成过滤,我将尝试ELSA。
Glogg是一个非常好的日志浏览器,因为您可以基于字符串和色线创建过滤器,也可以检索所有出现在字符串中的字符串。
您可以尝试SEQREL的LogXtender,它可以自动检测模式并汇总相似的日志。做到这一点的方法是动态创建正则表达式,并使用缓存的正则表达式匹配其他日志。通过其他分类检测,可以添加更多的粒度。可以从https://try.logxtender.net下载免费版本。
perl
。