可接受的平均负载


9

我们在星期五部署了新的Linux / Exim / Spamassassin邮件服务器(总是建议在长周末没有管理员的情况下部署第二天)。负载一直在15分钟的平均值上徘徊在1.3左右。

机器反应灵敏,并且邮件在合理的时间内送达。我们可以假设这是可以接受的吗?

一定量的负载如何被视为可接受或不可接受?使用什么指标?


3
多少个CPU,多少个RAM?它正在运行x / GDM吗?
Tim Howland

您每天要处理多少邮件?
baumgart

Answers:


11

基本经验法则:如果系统具有响应能力,并且系统运行及时,那么您就可以了。

负载低于两个就不用担心了。我的系统达到了四到五个,并且仍然可以正常工作,尽管这表明网络或驱动器存在很多排队问题(即使系统响应速度很快,I / O问题也可能导致高负载)。

定期检查您的邮件队列长度,并检查日志中是否存在无法传递的问题以及此类问题。如果交付队列保持相对较低,那就可以了。

您可以获取磁盘平均值和网络I / O信息,但是如果您没有看到传送问题(我在15分钟前发送了消息,但尚未到达!),则可以通过控制台在系统上工作(或ssh)而没有太多延迟,则应该没问题。


18

平均负载是一个值,该值给出了内核能够在需要时运行所有任务而无需等待的情况下所需的处理器数量。
在这种情况下,如果您具有2个或更多CPU /核心。没有问题。如果您只有1个CPU和1个Core,则意味着在您的应用要运行的时间与内核运行它的时间之间有太多的时间。负载>“ cpu /核心数”对于邮件系统来说不会成为问题,直到它在太长时间内达到太高的值为止。
当然,这不是要给予的规则和价值,虽然您可以在短时间内收到邮件,但没关系。但是,当负载超过2 * cpu / core数量的时间过长且持续很长时间(〜1小时)时,您可能需要开始仔细查看服务器。
再次对于邮件服务器来说,这不是什么大问题,但是它将开始意味着您的服务器有点过载。


+1有趣的东西!
Marco Demaio 2010年

3
我添加了指向一个相当不错的网页blog.scoutapp.com/articles/2009/07/31/…
半径

3

与调整相关问题一样,没有是/否答案,这取决于:-)

话虽如此,但1.3的负载听起来并不高,尤其是在您具有多核CPU配置的情况下。如果负载数与核心数相同,则所有核心始终具有准备运行的进程。

最终,如果按照您所说的那样及时发送邮件,则性能很好:-)

top

将为您提供足够接近实时的基本指标。


3
htop更好,更容易阅读
Antoine Benkemoun

3

平均负载小于您拥有的CPU的数量意味着没有闲置的CPU。平等意味着他们现在都在工作。更大意味着有一些进程可能正在运行,但仍处于排队等待状态。

对于像voip服务器或内存缓存这样的对时间敏感的超级事物,您希望平均负载平均值在核心数量以下。对于可以与偶发备份(例如电子邮件)一起使用的异步内容,您可以轻松地将内核数运行4倍。

需要记住的最大警告是,正在等待磁盘或网络I / O但可以运行的进程仍会显示在平均负载中。因此,如果您有一个向56k用户提供apache feed jpg的apache服务器,您可以运行的平均负载要比通过千兆位LAN向代理/负载平衡器回发php /任何脚本响应的平均负载高得多。在您的情况下,永久连接某附件的慢速邮件服务器的smtp连接将在运行队列上显示1进程,但可能会中断20次,从而向gmail发送快速的单线电子邮件而不会出现问题。

推来推去,平均负载就像DOW。它实际上并没有以任何方式衡量“经济”,人们只是将它用作一个松散相关的度量指标,因为它很容易谈论。专注于监视您实际关心的指标,例如传递队列深度和每秒的邮件数。


2

您有几个核心?猫/ proc / cpuinfo | grep处理器| wc -l

(注意:超线程看起来像更多的内核,但不是)

如果您的负载水平低于处理器数量,那么通常就可以了。

还要查看顶部并单击“ 1”,您可以观察每个CPU的单独负载。


1

是的,这是可以接受的,并且通常对于邮件过滤器是可以预期的。

我们的设置有些不同。我们有一个用于SpamAssassin的单独服务器,而我们的POP服务器运行ClamAV来扫描病毒。POP服务器通常在服务器负载为2的情况下运行,但有时峰值最多为10个或更多。另一方面,我们的SpamAssassin服务器曾经运行大约2个小时,直到我们还安装了Openprotect.com过滤器后,它使CPU使用率翻了一番,现在运行在大约5以下,峰值超过15。这仍然可以接受,因为我们不这样做邮件中的任何延迟都会导致邮件队列增加(我们将qmail用于传入的SMTP),并且仍有余地可以节省CPU使用/内存。

巧合的是,我强烈建议您使用Munin来监视您的服务器。它在视觉上展示历史数据并向您显示您需要保留哪些资源方面做得很好。使用Top(1)进行实时监视对您没有多大帮助。:)

哦,顺便说一句,在长周末之前的星期五进行部署是整个周末工作的方法。特别是对于关键系统,例如邮件服务器。


另请参阅collectd,如此处所述:serverfault.com/questions/67234/…–
沃伦

0

内存消耗如何?它稳定还是在增长?

负载似乎并没有超出正常范围。如果邮件服务器是响应型的,并且邮件正在通过,那么我说失败的唯一衡量标准是超出内存消耗的失败是通过错误的电子邮件(垃圾邮件)通过。

今天提醒您,这将是您的第一个真正的考验。我今天可能会对其进行监视。如果出了什么问题,现在是时候了。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.