Questions tagged «monitoring»

观察机器,系统和网络以发现问题并通知管理员的应用程序或设备。

6
check_load使用哪些警告和关键值?
现在我正在使用这些值: # y = c * p / 100 # y: nagios value # c: number of cores # p: wanted load procent # 4 cores # time 5 minutes 10 minutes 15 minutes # warning: 90% 70% 50% # critical: 100% 80% 60% command[check_load]=/usr/local/nagios/libexec/check_load -w 3.6,2.8,2.0 -c 4.0,3.2,2.4 但是这些值几乎是随机选择的。 …

1
htop-显示I / O等待百分比
有没有办法在htop中显示I / O等待百分比?我找不到一种方法来启用此功能。在接下来的环节存在的功能,我需要一个例子(以下简称“平均”行):http://www.concept47.com/austin_web_developer_blog/sysadmin/something-cool-i-learned-about-htop/ 但在我的htop 2.0.2版本不知道如何启用它。我知道我可以从iotop和类似工具获得此信息,但我希望在htop中获得此信息。
13 linux  monitoring  htop 

2
在我的服务器上检测垃圾邮件发送者
最近Undelivered Mail Returned to Sender,我在将新闻通讯发送给1500个客户之一时收到了一封。我的网站使用双重选择流程来确保用户明确希望接收我的新闻通讯。 错误信息: smtp; 554 ... Swisscom AG IP: 94.130.34.42, You are not allowed to send us mail. Please refer to xyz.com if you feel this is in error. 我收到了一个垃圾邮件示例(来自接收邮件服务器的邮件提供商): Received: from mail.com ([94.130.34.42]) by smtp-27.iol.local with SMTP id itOWeYZ6O42IFitOWe35TR; Tue, 13 Feb 2018 03:54:09 +0100 From: …

1
Monit系统管理系统的M / Monit接口的免费替代产品[关闭]
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,以使其成为服务器故障的主题。 6年前关闭。 我真的很喜欢Monit系统管理系统,但是我没有IT预算来购买M / Monit接口,该接口用于为我们的小型大学实验室管理多个主机。我检查了基于Ruby的 monittr,发现Django人们正在做饭。有人可以给我一些简单包装器的建议吗,可以帮助我从多台服务器中提取信息? 编辑:这个问题如何重复?我不是在问监控工具。在过去的两周中,我评估了其中的一半。我要问一个关于非常特定的监视工具的非常特定的问题。我承认,我从ewwhite收到的评论虽然令人不快, 但却是有效的观察。
12 monit  monitoring 

1
是否有人在使用SNMP和/或WMI轮询器将自定义指标推送到Amazon CloudWatch?
Amazon CloudWatch有一个不错的控制台,以及一个使用Amazon SNS进行通知的警报系统。 最初,它仅为您提供AWS指标,例如EC2实例CPU利用率。 最近,他们添加了自定义指标。您可以使用CloudWatch REST API推送您自己的任意指标。 我想知道是否有人尝试使用代理来通过SNMP和/或WMI轮询各种服务器(有些在EC2,有些不在),并将这些样本作为自定义指标推送到CloudWatch?因此,现在在CloudWatch中,您可以在一个地方同时查看所有指标(包括AWS和非AWS)。 注意:我知道某些监视工具可以从EC2中提取,这是将所有内容集中到一起的另一种方式,并且出于各种原因可能优于某些人。但是我在问CloudWatch在哪里是一个地方。 如果有人这样做,您将使用什么作为代理?

5
如何监视glusterfs音量
Glusterfs虽然是一个不错的分布式文件系统,但几乎无法提供监视其完整性的方法。服务器可以来来去去,砖块可能会陈旧或发生故障,并且我怕在为时已晚时才知道这一点。 最近,当一切似乎都正常运行时,我们遇到了一个奇怪的失败,但是一堆砖从体积中掉了下来(纯粹出于巧合)。 是否有一种简单可靠的方法(cron脚本?)可以让我知道我的GlusterFS 3.2卷的运行状况?

5
您如何在Windows中监视镜像磁盘的运行状况?
我的Windows 2003 Server上有一个镜像动态磁盘。您如何监视该卷的运行状况? 卷有问题时,是否可以让服务器发送电子邮件?有没有办法让服务器运行SMART测试? 编辑: WTF就像登录客户端服务器,运行DISKPART LIST VOLUME并看到它一样。 Volume ### Ltr Label Fs Type Size Status Info ---------- --- ----------- ----- ---------- ------- --------- -------- Volume 0 X xDrive NTFS Mirror 233 GB Failed Rd Volume 1 C NTFS Simple 57 GB Healthy System Volume 2 D DVD-ROM 0 B …

9
旧服务器应该退役吗
我的服务器仍然运行良好,但是已经使用了5年以上。他们仍然可以完美地完成工作,升级服务器没有任何优势,我应该让它们永久运行还是应该安排维护工作以用新硬件替换服务器或其部分?我担心服务器故障可能会导致数据丢失,并且比计划内的维护时间更长。这些服务器用于在线销售点,会计,CRM和管理信息。 由于服务器的远程位置,因此无法进行预防性维护,例如更换风扇和吸尘。 还要牢记故障率随时间的“浴缸曲线”。新硬件比已经烧毁一阵子的硬件更有可能发生故障。 您如何告诉对长期无故障服务器非常满意的客户,由于服务器太旧,现在不得不花钱更换它? 最后,是否有任何可以远程运行的硬件问题监控工具,例如电压,温度和风扇速度?

1
常见的WQL监控查询
您将使用哪些WQL查询来监视典型的Windows瓶颈?您将使用哪个来获取类似于“ top”或“ netstat”的数据?您的轮询间隔是多少? 这里有一些对我有帮助的。 SELECT PercentDiskTime, AvgDiskQueueLength, DiskReadBytesPerSec, DiskWriteBytesPerSec FROM Win32_PerfFormattedData_PerfDisk_PhysicalDisk SELECT Caption, CommittedBytes, AvailableBytes, PercentCommittedBytesInUse, PagesPerSec, PageFaultsPerSec FROM Win32_PerfFormattedData_PerfOS_Memory SELECT PercentProcessorTime FROM Win32_PerfFormattedData_PerfOS_Processor SELECT Caption, WorkingSet, PageFaultsPerSec,IOReadBytesPerSec, IOWriteBytesPerSec, ThreadCount, HandleCount FROM Win32_PerfFormattedData_PerfProc_Process SELECT Caption, BytesReceivedPerSec, BytesSentPerSec FROM Win32_PerfFormattedData_Tcpip_NetworkInterface
12 monitoring  wmi 

2
地理分布,容错和“智能”的应用程序/主机监视系统
问候, 我想问一下集体对分布式监视系统的看法和看法,您使用什么,知道哪些可能会打扰我? 要求非常复杂; 没有单点故障。真。我很认真!需要能够容忍“主”和“工作者”的单/多节点故障,并且您可能会假设没有监视位置(“站点”)中有多个节点,或者它们在同一网络上。因此,这可能排除了传统的HA技术,例如DRBD或Keepalive。 分布式逻辑,我想在多个数据中心和多个洲的多个网络中部署5个以上的节点。我希望从客户的角度看待我的网络和应用程序的“鸟瞰图”,当拥有50多个节点甚至500多个节点时,监控逻辑的加分点不会陷入困境。 需要能够处理相当合理数量的主机/服务检查(如La Nagios),据估算,假设有1500-2500台主机,每台主机30项服务。如果增加更多的监视节点使您能够相对线性地扩展,那将是非常不错的,也许在5年的时间里,我可能希望监视5000个主机和每个主机40个服务!加上我上面关于“分布式逻辑”的注释,很高兴地说: 在正常情况下,这些检查必须在$ n或n%的监视节点上运行。 如果检测到故障,请在另外$ n或n%的节点上运行检查,将结果关联起来,然后使用它们来确定是否已满足发出警报的条件。 图形和管理友好的功能。我们需要跟踪我们的SLA,并且了解我们的“高可用性”应用程序是否全天候24x7运行是很有用的。理想情况下,您建议的解决方案应该以最少的工作量“开箱即用”地报告。 必须具有可靠的API或插件系统才能开发定制检查。 需要对警报保持明智。我不想一定知道(通过SMS,凌晨3点!)一个监视节点认为我的核心路由器已关闭。我也想知道,如果一个定义了它们的百分比同意的东西时髦是要去;)本质上就是我这里所说的“法定”的逻辑,或理智的分布式疯狂的应用程序! 我愿意考虑商业和开源两种选择,尽管我更愿意避免花费数百万英镑的软件:-)我也愿意接受可能没有任何东西可以解决所有这些问题,但是想问一下集体。 在考虑监视节点及其位置时,请记住,其中大多数将是随机ISP网络上的专用服务器,因此很大程度上超出了我的控制范围。依赖BGP提要和其他复杂网络滑稽动作的解决方案可能不适合。 我还应该指出,我过去曾经评估,部署或大量使用/定制了包括Nagios,Zabbix和朋友在内的大多数开放源代码版本-它们虽然不是很差的工具,但总体上却落伍了。分布式”方面,尤其是在我的问题和“智能”警报中讨论的逻辑方面。 很高兴阐明任何要求。欢呼的家伙和女友:-)
12 monitoring  nagios  sla 

17
MySQL监控工具
已锁定。该问题及其答案被锁定,因为该问题是题外话,但具有历史意义。它目前不接受新的答案或互动。 您使用什么工具来监视MySQL服务器实例的运行状况?它们是免费的还是商业的?
12 mysql  monitoring 

6
使用SNMP监视Windows Server
这有多难?我想从远程Win 2k3计算机上获得当前的CPU性能。我需要使用SNMP,因为计算机位于防火墙后面。 假设: 我了解网络/可以配置任何类型的IP地址/端口转发/防火墙/材料。 我了解SNMP-我知道如何使用我的工具从目标计算机上的OID获取值。 我知道我想对我的SNMP请求的结果做些什么。 我已经在Windows Server上启用了SNMP,并配置了相关的IP安全/社区设置。 我已经可以使用SNMP询问Windows服务器标准的东西了,它有多少个磁盘/网络接口,等等。 问题:-我使用什么OID来简单询问当前的性能使用情况。 我花了很多时间问Google-清楚地问了一个错误的问题:S ....这有多难?

8
Nagios和Open NMS之间的主要区别是什么?
我希望向经理介绍一个全面的监视系统,并且一直在考虑使用OpenNMS。但是,我在这里看到了对Nagios的热烈赞扬,我希望有经验的人可以帮助说明我的主要差异。他们的重点有所不同,还是仅仅是竞争对手? 如果有背景帮助,我们可以运行6台本地服务器(文件服务器,PBX,代理,应用程序等)和2台非现场服务器(网站/开发),以及几个交换机和路由器。我们安装的监视服务将在运行freeBSD的单独转换桌面上运行。我们所有的东西都可以运行Linux或BSD衍生产品。 我们希望不花钱来实现这一目标(叹气)。 谢谢你的帮助。 编辑 看来openNMS提供了更接近我想要的更全面的解决方案。但是,由于它是用Java编写的,并且端口尚未在官方端口树中,因此已被否决。现在开始,我的Nagios不仅会比MRTG运动更好。感谢您的快速回复。 -机会


2
Monit将Apache列为“不受监视”
我刚刚根据monit文档安装并配置了monit。除Apache外,所有服务均列为“正在运行”,但Apache表示“ 未监视”。 monit的配置中的相关行是: check process apache with pidfile /var/run/httpd.pid group www start program = "/etc/init.d/httpd start" stop program = "/etc/init.d/httpd stop" if failed host localhost port 80 protocol http then restart if 5 restarts within 5 cycles then timeout 我可以从服务器访问http:// localhost / server-status和http:// localhost。Monit列出了Apache的监视模式为active。 服务器正在运行CentOS 5.4。 PID文件对于父httpd服务器是正确的: [server ~]$ cat …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.