Questions tagged «monitoring»

获取系统参数或事件(处理器负载,服务器响应能力,入侵尝试等)的实时值,或在某些事件发生时发出警报

2
如何跟踪用户在Linux上创建的可执行文件?
使用Linux,我想跟踪以我的名字执行的可执行文件,包括整个命令行(实际上,每个exec *()以我自己的用户身份完成)。我应该控制一个程序,以便处理任务,执行我传入的程序,但我想确保它能够执行以及使用了哪些选项。我无法控制的程序是偷偷摸摸的,并且似乎会根据应为该任务执行的程序的名称来更改行为,因此我无法传递将记录信息并调用真实程序的shell脚本程序。 是否可以在Linux系统上以用户身份通知我所有exec *(),包括完整的命令行?就是ps没有循环运行。我宁愿直接在我工作的系统上执行此操作,而不需要root用户访问权限,但是如果需要,我可以生成一个我具有root用户访问权限的系统,然后安装程序并在那里进行调查。 使用Ubuntu 12.4 LTS。

5
进程结束或被杀死时,是否可能获得SMS /文本消息通知?
有些脚本将在服务器进程完成后发送电子邮件。 但是,我不想经常检查我的电子邮件,只是为了查看工作是否完成。因此,我想收到一条短信。 我的问题与此类似,只是与所有出现的“电子邮件”交换SMS:是否有一个程序可以在过程完成时向我发送通知电子邮件? 您能想到任何解决方法/应用程序/脚本/在工作完成(或过早结束)时能够发送SMS的任何方法吗?

2
如何列出最消耗IO的文件?
我的文档管理软件正在处理大量IO,我想知道它访问最多的文件。 有没有一种Linux工具可以每隔几秒钟为我提供IO消耗最大的文件列表,例如iotop,但对于文件来说呢? 可能看起来像: $ thetool THRPUT R/W/SWP FILE 40MB/s write /usr/alfresco/repo/1283421/1324928.doc 12MB/s read /usr/alfresco/cache/3928dh29f8if 11MB/s read /tmp/239398hf2f024f472.tmp 我看着的手册页iotop,lsof,strace他们似乎并没有提供这样的功能。

2
过热导致系统关闭
我一直遇到过热的问题,这使我的笔记本电脑立即关机。无论如何,有没有监视传感器的温度并按比例缩小CPU频率以避免此问题的方法?是否有任何现有软件或Shell脚本可以处理该工作?

4
对每个命令强制使用“添加”别名
是否可以向其中的每个命令强行添加定时别名(因为缺少更好的用短语表达的方式)bash? 例如,我希望有一个特定的用户,每当运行命令时,该用户总是用date之前和之后或包裹time。 这可能吗?如果可以,怎么办?
11 bash  monitoring  alias  date  time 

1
perf_events列表中的内核PMU事件是什么?
在搜索什么人能够监测perf_events在Linux上,我找不到什么Kernel PMU event是?也就是说,与perf version 3.13.11-ckt39该perf list节目的事件,如: branch-instructions OR cpu/branch-instructions/ [Kernel PMU event] 总体上有: Tracepoint event Software event Hardware event Hardware cache event Raw hardware event descriptor Hardware breakpoint Kernel PMU event 而且我想了解它们的含义,来源。除了Kernel PMU event项目外,我对所有人都有某种解释。 从perf Wiki教程和Brendan Gregg的页面中,我知道: Tracepoints最清晰-这些是内核源代码上的宏,它们是监视的探针点,它们是随ftrace项目引入的,现在每个人都使用 Software 是内核的低级计数器和一些内部数据结构(因此,它们与跟踪点不同) Hardware event是一些非常基本的CPU事件,可以在所有体系结构上找到,并且可以通过某种方式轻松地由内核访问 Hardware cache event是-的昵称Raw hardware event descriptor如下 据我了解,Raw hardware …

2
移动文件,但仅在关闭状态下
我想在关闭后立即移动由外部进程创建的大文件。 这个测试命令正确吗? if lsof "/file/name" then # file is open, don't touch it! else if [ 1 -eq $? ] then # file is closed mv /file/name /other/file/name else # lsof failed for some other reason fi fi 编辑:该文件表示一个数据集,我必须等到它完成移动后才能使另一个程序对其执行操作。这就是为什么我需要知道外部进程是否已使用文件完成的原因。

2
在创建进程时打印进程的pid和名称
从这里的问题开始,OP希望重复轮询pidofshell脚本中使用的进程的pid 。当然,这效率很低,因为必须pidof每秒多次为该程序启动一个新进程(我不知道这是问题中CPU峰值的原因,但似乎很可能)。 通常,在Shell脚本中解决此类问题的方法是使用单个程序输出所需的数据stdout,然后在必要时进行一些文本处理。尽管这涉及到更多的程序要同时运行,但由于没有为轮询目的而不断创建新进程,因此它可能占用较少的CPU资源。 因此,对于上述问题,一个解决方案可能是拥有一些程序,该程序在创建过程时输出过程的名称和pid。然后,您可以执行以下操作: pids-names | grep some_program | cut -f 2 | while read pid; do process-pid "$pid" done 这样做的问题是,它提出了一个更基本的问题,如何在创建pid和进程名称时将它们打印出来? 我发现了一个名为的程序ps-watcher,尽管存在的问题是它只是一个perl反复运行的脚本,ps因此并不能真正解决问题。另一个选择是使用auditd,如果直接通过来处理日志,则可能会起作用tail -f。理想的解决方案比这更简单,更易于移植,但是auditd如果它是最佳选择,我将接受一个解决方案。



3
如何监视特定目录中的磁盘I / O?
我有一些名称已知的进程,它们全部写入单个目录中的文件。我想记录一段时间内(而不只是文件访问)磁盘块读写次数,以测试参数更改是否会显着减少I / O量。我目前正在使用iostat -d -p,但仅限于整个分区。

1
如何解释intel-gpu-top和intel-gpu-overlay的输出?
我已经编译并运行了这些命令,但是它们的内容对我来说还是个谜。 从intel-gpu-overlay读取的过程类似:15R, 16B, 41ms waits。什么是R,什么是B,等待时间表示什么? 它具有CPU:152%(我想这与我从顶部获得的内容相同)。渲染:32%,比特流:6%,比特率:6%。哪种类型的代码会导致这些值出现瓶颈,而当它们出现时,系统的行为如何? 这是intel-gpu-top的示例: render busy: 23%: ████▋ render space: 12/16384 task percent busy GAM: 29%: █████▉ vert fetch: 1380772913 (5386667/sec) CS: 23%: ████▋ prim fetch: 350972637 (1368891/sec) GAFS: 9%: █▉ VS invocations: 1375586768 (5385212/sec) TSG: 8%: █▋ GS invocations: 0 (0/sec) VFE: 7%: █▌ GS prims: …
10 monitoring  intel  gpu 

2
是否可以遵循命令(反复运行)?就像使用tail -f跟随文件一样?
我有一个脚本生成文件'Detail.out'。我知道只要文件包含一定数量的行(大约21025),脚本就完成了。所以我发现自己坐在命令提示符下运行: [me@somewhere myDir]$ wc -l */Detail.out 21025 A/Detail.out 21025 B/Detail.out 21025 C/Detail.out 12995 D/Detail.out 10652 E/Detail.out 3481 F/Detail.out 21027 G/Detail.out 21025 H/Detail.out 21025 I/Detail.out ... ... 我曾经tail -f看过一个特定的文件,但是我想跟踪wc -l */Detail.out上面显示的命令的输出。 这可能吗?tcsh如果有问题, 我目前在Ubuntu 11.04中使用。
10 monitoring  pipe  tail 

1
最繁忙的文件列表
我正在寻找一种工具,该工具将列出按文件中活动量排序的打开文件。因此lsof不会做这项工作(除非我忽略了一种使用方法lsof)。理想情况下,该工具应类似于top,并且应该能够在特定活动之间进行排序:读,写,字节,每秒查找。最好在RHEL / CentOS / EPEL中容易获得。 是否存在这样的工具?

2
互联网连接掉线警报
如果没有任何互联网连接5分钟,有什么软件可以播放警报(PC扬声器)? 我的交换机/路由器似乎每隔几天就会断开连接,我想在发生这种情况时将其重置。 PC -- TP-Link switch/router -- FO 192.168.x.1 -- 192.168.x.2 / x.y.z.a -- a.b.c.d

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.