我们在星期五部署了新的Linux / Exim / Spamassassin邮件服务器(总是建议在长周末没有管理员的情况下部署第二天)。负载一直在15分钟的平均值上徘徊在1.3左右。
机器反应灵敏,并且邮件在合理的时间内送达。我们可以假设这是可以接受的吗?
一定量的负载如何被视为可接受或不可接受?使用什么指标?
我们在星期五部署了新的Linux / Exim / Spamassassin邮件服务器(总是建议在长周末没有管理员的情况下部署第二天)。负载一直在15分钟的平均值上徘徊在1.3左右。
机器反应灵敏,并且邮件在合理的时间内送达。我们可以假设这是可以接受的吗?
一定量的负载如何被视为可接受或不可接受?使用什么指标?
Answers:
基本经验法则:如果系统具有响应能力,并且系统运行及时,那么您就可以了。
负载低于两个就不用担心了。我的系统达到了四到五个,并且仍然可以正常工作,尽管这表明网络或驱动器存在很多排队问题(即使系统响应速度很快,I / O问题也可能导致高负载)。
定期检查您的邮件队列长度,并检查日志中是否存在无法传递的问题以及此类问题。如果交付队列保持相对较低,那就可以了。
您可以获取磁盘平均值和网络I / O信息,但是如果您没有看到传送问题(我在15分钟前发送了消息,但尚未到达!),则可以通过控制台在系统上工作(或ssh)而没有太多延迟,则应该没问题。
平均负载是一个值,该值给出了内核能够在需要时运行所有任务而无需等待的情况下所需的处理器数量。
在这种情况下,如果您具有2个或更多CPU /核心。没有问题。如果您只有1个CPU和1个Core,则意味着在您的应用要运行的时间与内核运行它的时间之间有太多的时间。负载>“ cpu /核心数”对于邮件系统来说不会成为问题,直到它在太长时间内达到太高的值为止。
当然,这不是要给予的规则和价值,虽然您可以在短时间内收到邮件,但没关系。但是,当负载超过2 * cpu / core数量的时间过长且持续很长时间(〜1小时)时,您可能需要开始仔细查看服务器。
再次对于邮件服务器来说,这不是什么大问题,但是它将开始意味着您的服务器有点过载。
与调整相关问题一样,没有是/否答案,这取决于:-)
话虽如此,但1.3的负载听起来并不高,尤其是在您具有多核CPU配置的情况下。如果负载数与核心数相同,则所有核心始终具有准备运行的进程。
最终,如果按照您所说的那样及时发送邮件,则性能很好:-)
top
将为您提供足够接近实时的基本指标。
平均负载小于您拥有的CPU的数量意味着没有闲置的CPU。平等意味着他们现在都在工作。更大意味着有一些进程可能正在运行,但仍处于排队等待状态。
对于像voip服务器或内存缓存这样的对时间敏感的超级事物,您希望平均负载平均值在核心数量以下。对于可以与偶发备份(例如电子邮件)一起使用的异步内容,您可以轻松地将内核数运行4倍。
需要记住的最大警告是,正在等待磁盘或网络I / O但可以运行的进程仍会显示在平均负载中。因此,如果您有一个向56k用户提供apache feed jpg的apache服务器,您可以运行的平均负载要比通过千兆位LAN向代理/负载平衡器回发php /任何脚本响应的平均负载高得多。在您的情况下,永久连接某附件的慢速邮件服务器的smtp连接将在运行队列上显示1进程,但可能会中断20次,从而向gmail发送快速的单线电子邮件而不会出现问题。
推来推去,平均负载就像DOW。它实际上并没有以任何方式衡量“经济”,人们只是将它用作一个松散相关的度量指标,因为它很容易谈论。专注于监视您实际关心的指标,例如传递队列深度和每秒的邮件数。
是的,这是可以接受的,并且通常对于邮件过滤器是可以预期的。
我们的设置有些不同。我们有一个用于SpamAssassin的单独服务器,而我们的POP服务器运行ClamAV来扫描病毒。POP服务器通常在服务器负载为2的情况下运行,但有时峰值最多为10个或更多。另一方面,我们的SpamAssassin服务器曾经运行大约2个小时,直到我们还安装了Openprotect.com过滤器后,它使CPU使用率翻了一番,现在运行在大约5以下,峰值超过15。这仍然可以接受,因为我们不这样做邮件中的任何延迟都会导致邮件队列增加(我们将qmail用于传入的SMTP),并且仍有余地可以节省CPU使用/内存。
巧合的是,我强烈建议您使用Munin来监视您的服务器。它在视觉上展示历史数据并向您显示您需要保留哪些资源方面做得很好。使用Top(1)进行实时监视对您没有多大帮助。:)
哦,顺便说一句,在长周末之前的星期五进行部署是整个周末工作的好方法。特别是对于关键系统,例如邮件服务器。
collectd
,如此处所述:serverfault.com/questions/67234/…–