我们使用Nagios监视大量(〜130)服务器。我们监视每台服务器上的CPU,磁盘,RAM和其他一些东西。我一直使用SSH来运行远程命令,纯粹是因为它几乎不需要远程服务器上的其他配置,只需安装nagios-plugins,创建nagios用户并添加SSH密钥,所有这些我都已自动完成。一个shell脚本。我从未真正考虑过在NRPE上使用SSH的性能影响。
我对Nagios服务器上的负载没有太大的担心(它的功能可能过高,它从未超过10%的CPU),但是我们每30秒运行一次远程检查,每台服务器有5个不同的检查执行。我认为SSH每次检查都需要更多资源,但是有很大的不同吗?(IE的差异足以保证切换到NRPE)。
如果有帮助,我们将监视物理服务器(通常具有8、12或16个物理核心)和Amazon EC2中型/大型实例的混合。