最近,我在部署的某些Drupal站点上遇到了一些停机。我想主动解决此问题,而不是通过重新启动服务或服务器本身来应对那些停机时间。我已经阅读了有关监视工具的信息,例如nagios,munin,cacti等,用于监视服务器/基础结构的运行状况,但是我还没有真正在生产环境中尝试过这种工具。我几乎99%的时间都与Drupal打交道,并且我想找到有关服务器级别监视和Drupal(应用程序代码)级别监视的建议。
基本上,我希望在服务器负载很高时收到通知,可能是指出罪魁祸首(或受害者),以便我可以做出明智的决定。我还想知道在发生PHP错误/警告时,人们使用什么来进行Drupal级别的监视(例如,通过电子邮件发送)。(当电子邮件服务器本身关闭时会发生什么?)