有人可以解释默认穆宁图的“用例”吗?


9

安装munin时,它将激活一组默认插件(至少在ubuntu上)。另外,您可以运行munin-node-configure以找出系统上支持哪些插件。这些插件大多数都绘制直接数据。我的问题是无法解释的数据(也......也许对一些)的性质,但什么是你在这些图中寻找什么?

安装munin并查看花式图很容易。但是拥有这些图形而无法“读取”它们会使它们完全无用。

我将列出系统上默认启用的标准插件。因此,这将是一长串的清单。为了完整起见,我还将列出我认为可以理解的插件,并简要解释一下我认为该插件的用途。如果我对任何一个都不对,请改正。

因此,让我将这个问题分为三个部分:

  • 我什至不了解数据的插件
  • 我了解数据但不知道该注意什么的插件
  • 我想了解的插件

我什至不了解数据的插件

这些问题可能包含不一定仅针对穆宁的问题。不理解数据通常意味着在操作系统/硬件基础知识上的不足。;;)随意回答“ giyf”。

这些是我只能猜测发生了什么的插件...我几乎不想看这些“猜测” ...

  • 每个设备的磁盘IO(IO /秒)
    是什么IO。我知道它代表输入/输出。但是,就目前而言。
  • 每个设备的磁盘延迟(平均IO等待)
    不知道什么是“ IO等待” ...
  • IO服务时间
    这是一个巨大的混乱局面,几乎完全看不到图表中的任何内容。

我了解数据但不知道该注意什么的插件

  • IOStat(读取/写入的块/秒),
    我想,这里要注意的是峰值吗?这将意味着该设备被大量使用?
  • 可用熵(字节)
    我认为这对随机数生成很重要吗?我为什么要画这个图?到目前为止,该值一直接近恒定。
  • VMStat(运行中/ I / O睡眠过程)
    和“过程”图有什么区别?两者都显示正在运行/正在休眠的进程,而“进程”图似乎具有更多详细信息。
  • 每台设备的磁盘吞吐量(字节/秒读/写的字节数)
    该设备与“ IOStat”图之间的区别是什么?
  • inode表的用法
    在此图中我应该寻找什么?

我想了解的插件

我会在这里猜测一些事情...如果我错了,请纠正我。

  • 磁盘使用百分比(百分比)
    已使用/剩余的磁盘空间。随着接近100%,您应该考虑清理或扩展分区。这对于根分区非常重要。
  • 防火墙吞吐量(数据包/秒)
    穿过防火墙的数据包数量。如果这种情况持续了很长时间,则可能是DOS攻击的征兆(或者我们只是接收到一个大文件)。它还可以使您对防火墙的性能有所了解。如果正在逐步升级并且您需要更多的“电源”,则应考虑负载平衡。如果正在升级,并且发现与您的CPU负载相关,则也可能意味着您的硬件不够快。与磁盘使用率的相关性可能表明FW配置中的LOG目标过多。
  • eth0错误(数据包输入/输出)
    网络错误。如果该值增加,则可能是硬件故障的迹象。
  • eth0流量(位/秒进/出)
    原始网络流量。这应该与防火墙吞吐量相关。
  • 线程数
    不断增加的值可能表示进程未正确关闭线程。调查!
  • 进程
    活动进程的分解(包括睡眠)。此处的快速飙升可能指向叉式炸弹。缓慢但不断增加的值可能表明应用程序生成了子流程,但未正确关闭它们。使用进行调查ps faux
  • 流程优先级
    这显示了流程优先级的分布。仅具有高优先级的过程没有多大用处。考虑取消优先级。
  • cpu用法
    相当简单。如果出现这种情况,则可能是正在进行攻击,或者进程占用了CPU。Idf在缓慢增加并在正常操作中接近最大值时,您应该考虑升级硬件(或负载平衡)。
  • 文件表使用情况
    主动打开的文件数。如果达到最大值,则可能有一个进程正在打开,但没有正确释放文件。
  • 平均负载
    显示系统负载的汇总值。应与CPU使用率相关。增值可以来自多种来源。寻找与其他图形的相关性。
  • 内存使用情况内存
    的图形表示。只要您有许多未使用的+缓存+缓冲区,就可以了。
  • swap in / out
    显示交换分区上的活动。该值应始终为0。如果看到此操作,则应在计算机上添加更多内存!

很好的问题,很容易适用于Cacti和其他绘图应用程序。这些图通常看起来很不错,但是很难弄清楚它们的含义,而且看起来还需要进一步注意。
dunxd 2011年

2
对于“为什么要对此图形化?到目前为止,该值始终接近恒定”。部分,请记住,大多数信息通常仅在出现问题时才有价值。
史蒂夫·施耐普

Answers:


11

每个设备的磁盘IO(IO /秒)

对于传统的硬盘驱动器,这是一个非常重要的数字。I / O操作是对磁盘的读取或写入操作。使用旋转主轴,根据磁盘速度及其使用方式,每秒可以达到几十到200 IOPS。

这还不是全部:现代操作系统的确具有I / O调度程序,这些I / O调度程序试图将多个I / O请求合并为一个,从而使事情变得更快。RAID控制器等也确实执行一些智能I / O请求重新排序。

每台设备的磁盘延迟时间(平均IO等待时间)

从对单个磁盘执行I / O请求到从那里实际接收数据需要多长时间。如果这个时间徘徊在几毫秒左右,就可以了,如果是几十毫秒,那么您开始看到磁盘子系统满头大汗,如果再过几百毫秒,您就会遇到大麻烦,或者至少有一个非常非常大的麻烦。缓慢的系统。

IO服务时间

磁盘子系统(可能包含许多磁盘)的总体性能如何。

IOStat(块/秒读/写)

每秒读取/写入多少磁盘块。寻找峰值和平均值。如果平均值开始接近磁盘子系统的最大吞吐量,那么该是时候计划性能升级了。实际上,在此之前要进行计划。

可用熵(字节)

某些应用程序确实希望获取“真实的”随机数据。内核从多个来源收集“真正的”随机性,例如键盘和鼠标活动,在许多主板中找到的随机数生成器,甚至从视频/音乐文件中收集(视频熵和音频熵都可以做到这一点)。

如果您的系统用尽了熵,那么想要该数据的应用程序将停止运行,直到它们获取数据为止。在过去,我个人曾经看到Cyrus IMAP守护程序及其POP3服务发生这种情况。它在每次登录之前以及在繁忙的服务器上生成了一个长随机字符串,该服务器非常快地消耗了熵池。

解决该问题的一种方法是将应用程序切换为仅使用半随机数据(/ dev / urandom),但这已不再是本主题之一。

VMStat(运行/ I / O睡眠进程)

以前没有考虑过这一点,但是我认为这可以告诉您有关每个进程的I / O统计信息,或者主要是它们是否正在运行某些I / O,以及该I / O是否阻止了I / O活动,或者不。

每个设备的磁盘吞吐量(字节/秒读/写)

这纯粹是每秒读取/写入的字节,并且通常情况下,它比可能更易读,而不是。块大小可能因使用的磁盘,使用的文件系统(及其设置)等而异。有时,块大小可能是512字节,有时是4096字节,有时是其他。

inode表的用法

对于具有动态索引节点的文件系统(例如XFS),什么也没有。对于具有静态索引节点映射(例如ext3)的文件系统,所有内容都是如此。如果您将静态索引节点,庞大的文件系统以及大量的目录和小型文件组合在一起,则可能会遇到无法在该分区上创建更多文件的情况,即使理论上会剩下很多可用空间。没有可用的inode ==不好。


考虑索引节点的用法。我当前正在使用ext4,并且该图中的max-indode和open-inodes非常接近(open:31.11k表大小:32.12k)。这将使我剩下约1k个索引节点。由于系统是全新安装的,因此我不认为这是一个问题。ext4是否动态分配inode?我还没有在Google上找到任何相关的信息……
exhuma 2011年

请参阅df -i,它报告您当前的inode使用情况。ext4修复了inode,例如我的根分区的Fedora 16报告rootfs 3276800 238083 3038717 8% /
Janne Pikkarainen

嗯...有趣。这表明穆宁图不正确。我也没有意识到,munin图仅显示一个值。它不应该在每个文件系统中显示一个值才有用吗?又见df -i截图(i44.tinypic.com/oixkiq.png VS的穆宁-图表)(i39.tinypic.com/dxl64z.png
exhuma

...在df输出中实际上根本看不到图形中的值(25.57k)。
2011年

经过进一步调查,我发现munin插件open_inodes从中获取了值/proc/sys/fs/inode-nr。它是一个内核,而不是文件系统值。进一步的谷歌搜索使我注意到了这一点:mjmwired.net/kernel/Documentation/sysctl/fs.txt#119从该文档中,我认为可以在中找到该限制inode-max。但是该文件在我的系统上不存在。这可能不再与更新的内核有关吗?这将允许我从munin实例中删除该图!
2011年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.