如何监视和记录服务器硬件温度和负载


15

我正在寻找一种记录和监视服务器硬件温度和负载(例如CPU或RAM)的方法。我该怎么办?

目的是:

  • 确保硬件不发热
  • 确定应该升级的东西和多余的东西(例如,也许要学习,也许得不到这样好的CPU)

好了,我可以使用任务栏中的小程序之一,但是记录日志呢?

Answers:


18

如果您想要的东西不依赖于台式机

看一下lm传感器 安装lm传感器。根据说明:

Lm-sensors是Linux的硬件运行状况监视软件包。它允许
您可以访问有关温度,电压和风扇速度的信息 
传感器。它适用于大多数较新的系统。

该软件包包含帮助您设置和读取数据的程序
lm传感器。

从他们的项目页面(2016年编辑:项目已死。我们自己的Wiki中有一些信息):

  • 无人值守的高端服务器,路由器或其他关键任务机器的自动化监控。轻松创建cron作业,以查询硬件状态并在出现问题之前将其发送给您,并在问题变得严重之前向您发送电子邮件。这样,您可以在几秒钟之内收到关键组件(例如电源,风扇,其他冷却装置)发生故障的警报,甚至检测是否已打开机箱。
  • 运行Linux的嵌入式系统。这些人员可以使用此软件包使用现成的组件并利用一系列总线接口(例如ISA,SMBus,I2C或SPI)来监视电压,温度,风扇速度等。
  • 更一般而言,数据采集。使用廉价的现成零件即可轻松测量各种类型的数据(转速,电压,温度等)。对于系统自动化(在家庭,车间,气象站中,您可以命名)非常有用。

lm-sensors有一个名为sensord的守护进程,该守护进程使用RRDtool进行“时间序列数据的数据记录和图形系统”。因此,它包括可以通过网络服务器显示的此类图形:

im1

(摘自lm-sensors项目页面)。

要安装sensord守护程序,您可能必须安装sensord软件包。

我的笔记本中的示例:

im2

的配置文件位于 /etc/sensors3.conf

lm-sensors是任何温度测量的基础。桌面项目很有可能从此软件包中获取其信息。一个示例如果您想要一些依赖于台式机的产品

psensor。

  • 主板和CPU传感器(需要安装lm传感器)。
  • NVidia GPU
  • 硬盘驱动器(需要安装hddtemp)。
  • 风扇速度(同样,需要安装流明传感器)。

通过添加PPA进行安装:
sudo add-apt-repository ppa:jfi/ppa
sudo apt-get update && sudo apt-get install psensor

(Oneiric将包含psensor)

(旧)来自ubuntugeek.com的示例: im6


看起来是个不错的答案。似乎图像和链接已损坏。:-/
user121330 '16

该图像只是安装程序图标;-)有关操作的信息,请参见meta.askubuntu.com/a/1853/15811(任何人都可以将其更改为hostmar.co/software-smallhostmar.co/software-large)。但是项目本身已经死了....可惜:*(
Rinzwind

5

如果像Cacti这样的程序太多了,那么有一个脚本每天都会记录到文本文件-使用crontab运行它。但是需要安装lm-sensors程序。

#!/bin/bash
_now=$(date +"%Y_%m_%d")
_file="temp_log_$_now.txt"
(date; sensors; echo '-----------') | cat >> "/var/log/temperatures/$_file"

4

对于在服务器记录 cpu / ram / temperatures / traffic ,我建议使用Cacti。它被宣传为“ RRDtool的完整前端”,并且可以具有多个数据源,例如lm传感器,SNMP甚至自定义脚本。数据存储在RRD中,并用于创建每日,每周,每月和每年的图形。

有关更多详细信息,屏幕截图和实时示例站点的链接,请访问Cacti网站。第一次设置可能很棘手,但最终还是值得的。


2
安装MySQL的要求限制了其用例
Scott Stensland 2016年

3

我在办公室使用zenoss监视大约70个unix和Windows服务器。我们还监视所有网络设备,甚至服务器室中的恒温器。大部分是通过SNMP。(但是,我们使用一些自定义的编写脚本来监视某些应用程序性能)

大多数服务器(例如Dell和hp)都具有内部温度传感器,您可以使用SNMP进行查询。您还可以监视进程,CPU利用率,网络吞吐量等。如果服务器脱机或开始使用过多的CPU,或者关键进程出现故障,我会收到警报。

认真地说,我不能敦促去看诸如zenosshypericnagios之类的东西!免费版本可以监视多个系统,但它们也可以监视一个系统。他们可以帮助您进行故障排除,并找出发生问题时凌晨2点服务器的运行情况。


1

检查此链接:https : //launchpad.net/indicator-sysmonitor

im1

(来自OMG Ubuntu

安装:

sudo add-apt-repository ppa:alexeftimie/ppa
sudo apt-get update && sudo apt-get install indicator-sysmonitor

备注:仅适用于Natty / 11.04


这也许是一个非常愚蠢的问题,但是我该如何安装呢?我试着sudo add-apt-repository 'deb http://ppa.launchpad.net/alexeftimie/ppa/ubuntu natty main'sudo apt-get install indicator-sysmonitorUnable to locate package indicator-sysmonitor
Jiew萌

@jiewmeng我使用图像和安装方法进行了编辑
Rinzwind

1

我一直在使用pandora fms来监视我公司及其网页上的大约40台服务器和100台计算机系统。您可能会发现在服务器上安装软件代理并设置本地模块以监视所需内容很有用。如果您想在这里尝试,可以访问pandora的网页:Panndora FMS统一监控工具

问候

伊沃·约达诺夫(Ivo Yordanov)


1

检查软件包munin,它可以监视几乎所有东西。

https://help.ubuntu.com/lts/serverguide/munin.html https://wiki.ubuntuusers.de/munin

sudo apt-get install apache2
sudo apt-get install munin-node`
sudo systemctl enable munin-node
sudo a2enconf munin

检查/etc/apache2/conf-enabled/munin.conf中的访问权限,如下所示:

<Directory /var/cache/munin/www>
    Require all granted
    AllowOverride None
    Order Allow,Deny
    Allow from all
    Options None
</Directory>

<Location /munin-cgi/munin-cgi-graph>
    Require all granted
    <IfModule mod_fcgid.c>
        SetHandler fcgid-script
    </IfModule>
    <IfModule !mod_fcgid.c>
        SetHandler cgi-script
    </IfModule>
</Location>

重新启动apache2:

sudo apache2ctl restart

将浏览器启动到:http:// localhost / munin-享受。

查看/ etc / munin以获取更多选项。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.