每个系统管理员都应该使用哪些工具?[关闭]


42

我想知道功能强大的工具,大多数系统管理员要么不知道,要么不使用(但应该使用)。

一方面,我喜欢发现一个好的工具的可能性,我应该使用它-至少要尝试一下。我还发现,再次给这些工具多花些时间可能是一件很积极的事情,让其他人知道那里存在的奇妙工具。

因此,诸如sudo,vi,emacs,dtrace,ps和top之类的东西都消失了。我有一些想法,但我只是讨厌歪曲统计数字...

我将等一下,看看是否有人提到我的最爱。


7
有很多“什么工具”的问题,我们真的需要另一个吗?
Zoredache

4
我只想问:如果没有人听说过一种工具,那么它将如何获得好评?
quux

5
拍照手机+1。当通过电话与某人联系以解决问题并且屏幕上显示一长条错误消息时,它们也非常有用。我希望所有人都能使用/使用它们。
马克

1
我用它来记录前面板的灯光和后面板的端口(在这种情况下,是DEC Alpha系统的端口)。

2
请为每个答案提及一种工具。
Cristian Ciupitu 09年

Answers:


33

iPerf

Iperf可帮助您运行测试以衡量最大TCP和UDP带宽性能。它允许调整各种参数和UDP特性,从而报告带宽,延迟抖动,数据报丢失:http : //openmaniak.com/iperf.php


,和

港铁

MTR(我的追踪路线)也是一个很好的工具。它在单个网络诊断工具中结合了“ traceroute”和“ ping”程序的功能。与traceroute一样,除了它提供了更多的网络质量和网络诊断信息之外。保持运行以获取实时统计信息。报告最佳和最差往返时间(以毫秒为单位)...显示延迟,抖动(平均/最佳/最差):http : //www.bitwizard.nl/mtr/

采用:

mtr server.domain.com(或IP)

  • 使用“ O”添加更多字段,键入“ LDRS NBAW V JMXI”,然后按Enter。
  • 键入“ n”以关闭/打开DNS

替代文字http://locobox.googlepages.com/mtrsavedw.jpg


2
+1为地铁。每次都击败traceroute。
David Pashley

除了他们何时阻止ICMP并允许UDP。然后返回到traceroute -PUDP。
sh-beta

1
@ sh-beta或mtr -u;)
l0c0b0x

我真的,真的希望这是最近的事态发展。我浪费的时间!唉!
sh-beta

24

回形针: 我不得不用回形针捡起太阳和戴尔服务器前面的锁,我们都用它们来打开CD-ROM。

HotPlug 这个东西很棒。是否想在不关闭服务器的情况下将服务器移至下一个机架? http://www.wiebetech.com/products/HotPlug.php

笨拙的木头 你没有正确安装服务器之前的白痴?服务器太旧而无法安装机架?木头块是你的朋友。这是贫民窟,但行得通。


1
哇,木头块...你是对的,那是相当贫民窟。不过,您仍然可以为热插拔+1
Matt Simmons 2009年

3
当我将木头安装在机架中时,我用木头来防止UPS压坏我。
steve.lippert

我支持Matt-hotplug是当今最好的链接。
卡拉·玛菲亚(Jara Marfia)2009年

热插拔链接-哇。
丹·卡利

HotPlug的另一票。太棒了
Nic

19

弯曲的曲别针可弹出以打开CD驱动器。


5
我开始将它们挂在我们所有服务器机架的门上-它们也非常适合隐藏凹陷的重置按钮。人们开始问到底是什么纸夹正在吊在门上,直到我解释了。现在他们同意这是一个很好的主意。
马克

1
我一直都在钱包里放一个。没有人应该没有的东西!
Matt Simmons

1
今天,我了解了它们的实用性!是时候看看它是否会选择强力面板锁...
卡拉·

我用一些回形针和一些电工胶带制成了一个不错的手柄,像我这样的大手可以使用。
steve.lippert

我忘了!:您可以打开的塑料拉链锁的关系与他们standalone-sysadmin.blogspot.com/2008/10/...
西蒙斯

18

Sysstat / Sar-出色的服务器历史监控。

如果您需要检查机器为什么停机,则网络/ CPU /内存/ IO / etc / etc很好。

例如,今天早上6点至7点之间的平均负载为:

hcooper@localhost:~$ sar -q -s 06:00:00 -e 07:30:00
Linux 2.4.27-3-686 (localhost)  06/06/09

06:05:01      runq-sz  plist-sz   ldavg-1   ldavg-5  ldavg-15
06:15:01            2       200      0.00      0.05      0.04
06:25:01            4       199      0.01      0.05      0.04
06:35:02            0       208      1.74      1.39      0.79
06:45:01            1       201      0.12      0.52      0.70
06:55:02            1       197      0.04      0.14      0.40
07:05:01            2       203      0.13      0.10      0.24
07:15:01            2       200      0.00      0.05      0.15
07:25:01            2       200      0.01      0.04      0.08
Average:            2       201      0.26      0.29      0.30

如果管理员没有听说过这个,我会感到惊讶:我一直对不包含这些古老工具的Linux发行版以及默认情况下未启用这些工具的其他UNIX感到惊讶。

17

纸袋:发现您编写的SQL脚本实际上并没有真正混入测试数据库时,请深呼吸。哦,您的备份系统崩溃了,现在您需要等待技术支持的电话,因为您没有支持合同。

折纸打消您在备份软件供应商处获得1级技术支持的时间。

压力球:在他们最终接听电话后,在第1层支持人员讨论问题时提供帮助。

一个冰袋:当您意识到花了90分钟才获得第二层支持时,将它砸在桌子上后就可以舒缓疼痛的拳头。

备用手机:当您断开连接时,将自己扔到地上后,就像第3层支持人员接听电话一样。

在Monster.com上的帐户和铺设地毯的经验:=(

-

稍微有点严重的一点是,拥有一个小型冰箱会特别方便,特别是对于将崩溃的硬盘放入尝试并恢复数据的情况。

此外,如果您的照相手机可以拍摄视频,那就更好了。当我遇到BIOS和其他我在编辑时没有时间同时记录文档的东西时,我会拍摄视频。

咳嗽药水和鼻喷雾剂可在干燥的服务器室中长期停留。

一个的P-touch标签机给标签一切就算你肯定你会记得这补丁电缆连接到安全摄像头。

指甲钳,用于从Cat5电缆的4对电线中去除护套。

银色刺刀,用于当您必须标记具有深色表面的东西时。


至理名言!
pQd

Silver Sharpies ...我忘了所有这些东西,我曾经随身携带这些东西。
约瑟夫·科恩

当您要某人为笔记本电脑的底部签名时,它们也很方便携带。我一直都在背包里放一些东西。
韦斯利2010年

16

我使用iproute软件包(还包括出色的ip和tc命令)中的“ ss ”来获取有关tcp / udp套接字的信息。它提供了常规'netstat'的更多信息,并且可以与过滤器一起使用,例如:

$ ss -o state established '( dport = :www or sport = :www )'
Recv-Q Send-Q Local  Address:Port                  Peer Address:Port   
0      0      192.168.22.100:52430                 209.85.173.118:www     
0      0      192.168.22.100:51115                 209.85.229.101:www     
0      0      192.168.22.100:49105                 209.85.227.104:www     
0      0      192.168.22.100:37792                 209.85.227.101:www     
0      0      192.168.22.100:60337                 69.59.196.212:www     
0      0      192.168.22.100:37794                 209.85.227.101:www   

对于该信息,use netstat -nt|grep :80。它更加简洁,如果您习惯使用不花钱的标准工具箱,则可以在新服务器上运行,而不必费心安装东西。
mc0e


15

“加速”以确定LAN中的计算机是否真正启动。通过使用ARP数据包绕过ICMP回显(ping)的所有阻止工作。


那里有两种不同的Arping程序:我唯一喜欢的一个程序可以让您按MAC地址ping主机-另一种是我相信由Red Hat产生的Arping。

1
我应该提到,这两个Arping程序在大多数发行版中都可用,并且它们冲突。一个是iproute2的一部分,另一个是独立的。维基百科描述了两者;我喜欢的Arping是Thomas Habets 创作的

13

几个网络工具:

tshark的 -图形化网络流量分析的实时文字版- Wireshark的。当tcpdump的原始输出不足以供您使用时,tshark可以解决问题。样本:

1041488.938623 192.168.10.14 -> 123.13.42.143 TCP 2525 > 25 [SYN] Seq=0 Len=0 MSS=1460
1041488.964593 192.168.10.14 -> 123.13.42.143 TCP 2525 > 25 [ACK] Seq=1 Ack=0 Win=65535 Len=0
1041488.997561 192.168.10.14 -> 123.13.42.143 SMTP Command: EHLO s72f30c9a2c784
1041489.034541 192.168.10.14 -> 123.13.42.143 SMTP Command: AUTH LOGIN
1041489.064026 192.168.10.14 -> 123.13.42.143 SMTP Message Body
1041489.095757 192.168.10.14 -> 123.13.42.143 SMTP Message Body
1041489.304390 192.168.10.14 -> 123.13.42.143 SMTP Command: MAIL FROM: <someone@somewhere.cx>
1041489.375849 192.168.10.14 -> 123.13.42.143 SMTP Command: RCPT TO: <anotherperson@wherever.se>
1041489.409579 192.168.10.14 -> 123.13.42.143 SMTP Command: DATA
1041489.470060 192.168.10.14 -> 123.13.42.143 SMTP Message Body
1041489.503278 192.168.10.14 -> 123.13.42.143 SMTP Message Body
1041489.529797 192.168.10.14 -> 123.13.42.143 SMTP EOM:
1041492.660752 192.168.10.14 -> 123.13.42.143 SMTP Command: QUIT
1041492.726452 192.168.10.14 -> 123.13.42.143 TCP 2525 > 25 [FIN, ACK] Seq=2362 Ack=281 Win=65254 Len=0
1041492.734770 192.168.10.14 -> 123.13.42.143 TCP 2525 > 25 [ACK] Seq=2363 Ack=282 Win=65254 Len=0

httpry实时被动http分析器。样本输出:

06/06/2009 13:36:16     74.125.77.104   192.168.10.138  <       -       -       -       HTTP/1.1        204     No Content
06/06/2009 13:37:16     192.168.2.255   212.77.100.101  >       GET     wp.pl   /       HTTP/1.0        -       -
06/06/2009 13:37:16     212.77.100.101  192.168.2.255   <       -       -       -       HTTP/1.0        302     Found
06/06/2009 13:37:16     192.168.2.255   212.77.100.101  >       GET     www.wp.pl       /       HTTP/1.0        -       -
06/06/2009 13:37:16     212.77.100.101  192.168.2.255   <       -       -       -       HTTP/1.0        200     OK

这两种工具对于排除远程办公室/网络中用户报告的某些连接性问题非常有用,在远程办公室/网络中,您只能访问边缘网关。

和通常的监视收藏夹:

  • nagios用于警报,bash或任何其他脚本语言,以编写您自己想要监视的内容的检查
  • munin绘制趋势图

再次感谢您提醒Wireshark的文本组件:我总是忘了它(我的损失)。下次我到达tcpdump时,我将不得不切换并尝试一下。

13

PV管道查看器。将其插入流水线中的命令之间以获取指示数据移动速度,直到完成的时间等信息。它还可以用作速率限制器。


11

strace在数量众多的地方很有用。


打个招呼-我也喜欢这个工具。
MikeyB

1
嗯,这是做什么的?
亚历克斯。S.


另外,查找“性能跟踪”。它可以提供与strace类似的信息,但是它是更新的,并且在内核中使用其他子系统来收集其跟踪信息(Linux Perf计数器)。我还没有足够地使用它来了解为什么要使用其中之一,但是值得一看。
Noah Spurrier 2014年

10

Windows:Nbtstat(有很多技巧,但是-A可以用来获得远程IP的计算机名称,这非常方便,前提是您处于允许权限的环境中)

所有的sysinternals工具(进程浏览器,调试视图等)。特别是调试视图,您会惊讶于有多少服务器程序将有趣/有用的东西写入调试日志,这是我知道的唯一查看方法。这些是必须具备的。

Unix:strace / ktrace / truss是我最喜欢的工具(最好的非显而易见的用法,如果正在运行某个进程,将其stderr重定向到/ dev / null并且您不想停止它,请监视写入的调用fd2。

lsof :(打开文件的列表)我总是忘记了这一点,但是当您需要它时,就需要它。


6
lsof +1-很棒
Dennis Williamson 2009年

当您仅知道远程工作站的名称或IP时,Nbtstat也会非常方便地获取远程工作站的MAC地址。
马特·汉森

nbtstat在开放源代码中具有UNIX等效版本,但我永远找不到。
梅,


9

耳塞可在嘈杂的数据中心中执行更长的操作。


+1是因为我最近不得不在一个盒子上工作,每次我启动时,RAID控制器都会进行一次令人费解的痛苦操作,直到以正确的顺序插入驱动器为止。
Nic 2010年

8

上面的很多建议与网络有关。但是对于SysAdmnin:

htop-Linux的交互式进程查看器

这是htop,是Linux的交互式过程查看器。它是一个文本模式应用程序(用于控制台或X终端),需要ncurses。经过Linux 2.4和2.6测试。

或人类可读的上衣

http://htop.sourceforge.net/


我也喜欢htop:非常好。使用htop之类的名字,我也经常想起atop:atcomputing.nl/Tools/atop。我通常将两者都安装在我使用的任何Linux机器上。Htop色彩鲜艳,易于理解且外观精美;atop是全面的,并且还保存历史数据。

8

一根细化的回形针。我曾经在一个满满的架子上放了一个螺丝。在那儿。我的办公桌上粘着一块强磁铁,但它无法将绳子固定在桌子上。所以我在系上一些拉绳后发现了一个较厚的回形针并被磁化了。我在服务器滑轨和机柜门之间的空间中,将其轻轻向下送入机架的左侧。戳了一下,但找到了我需要的螺丝。经过几次尝试,我才能将其拉回顶部,而又不会再次掉落。

精致的工作。当时我大声发誓说我小时候玩的“操作”显然不够。


我父亲的工具箱中有一个。maplin.co.uk/free_uk_delivery/…。我一直在偷东西。
Murali Suriar


7

以Unix为中心的答案(简单工具):

  • ntop(不敢相信我还没有看到这个)
  • tcpdump /监听
  • SAR的双重推荐
  • rsync(如果没有它,生活会比什么都糟)

7

多尾是必须的。在一个屏幕上监视多个文件。也可以跟随文件名而不是描述符。

替代文字


2
很好,但是与使用GNU屏幕实用程序在两个窗口中运行标准tail -f有什么不同?

尾巴不会在图案上着色。您也无法向后滚动并查看积压。
Marcin

实际上,您可以向后滚动:GNU屏幕具有内置了搜索和复制功能的回滚缓冲区
Mei

6

我赞同手电筒的意见,尽管我更喜欢前照灯,而不是小型磁铁。放开双手。

我还发现了一种单击式圆珠笔可以派上用场。当您发现文件服务器崩溃并丢失所有内容时,可用于拉直VGA电缆上的引脚(当笔缩回时),按下重置按钮以及刺破自己的喉咙。


3
头灯+1 ...发现他们在露营中有多有用,只是将使用转移到工作上
。.– Cube_Zombie

6

vnstat派上用场-一个小的流量监视器,以与vmstat相同的方式提供输出,例如:

> eth1
> 
>            received:       1.40 TiB   (48.4%)
>         transmitted:       1.50 TiB   (51.6%)
>               total:       2.90 TiB   since 20.11.08
> 
>                         rx      |     tx      |   total
>         ------------------------+-------------+------------
>         yesterday      6.15 GiB |    8.50 GiB |   14.65 GiB
>             today      6.98 GiB |    4.77 GiB |   11.75 GiB
>         ------------------------+-------------+------------
>         estimated      7.82 GiB |    5.35 GiB |   13.17 GiB

5

Systemtap岩石。Systemtap为您提供了非常简单易用的工具,可用来编写检查内核各个部分的内核模块。相当深的技术,但有时非常非常有用。

除此之外,我会说:sysstat和rrdtool的组合用于长期趋势分析。


不幸的是,Ubuntu不支持开箱即用。它需要黑客才能开始工作。

5

看来您的帖子倾向于Linux,但这是Windows的帖子,即使直到最近我才知道:

getmac

C:\Admin>getmac

Physical Address    Transport Name
=================== ==========================================================
42-35-7C-4F-85-1b   \Device\Tcpip_{72338DC1-13A4-8514-2C1B-60FC3B4559DB}
00-11-05-86-D2-C0   \Device\Tcpip_{CCD25CFB-7765-1BE2-C59B-57C05FD32B67}

C:\Admin>

10
getmac是有点绝望的恕我直言。有谁知道哪个接口“ \ Device \ Tcpip_ {72338DC1-13A4-8514-2C1B-60FC3B4559DB}”不在他们的头上?我更喜欢“ ipconfig / all”或什至像“ get-wmiobject win32_networkadapter |格式表名称,netconnectionid,macaddress”这样的PowerShell单行代码。
ThatGraemeGuy

Linux的问题(和收益)是几乎没有什么是您不能做的。即便如此,这些工具中的许多工具仍可用于其他环境。

5

od-八进制转储

字符串-在文件中查找可打印的字符串


我曾经度过了一个有趣的下午,在Linux内核上运行“字符串”,并在输出中添加了各种粗鲁的单词。那些内核开发人员可能很嘴巴!
RainyRat 2011年


5

可编程的Bash完成功能。让生活变得不那么容易出错。他们并不难写。

GNU grep的一些不太明显的选项,尤其是--color,-P和-o。

我的标准快速报告一线:

grep something /some/logfile | sort | uniq -c | sort -n

从日志文件进行简单的频率分析:

grep something /some/log | grep -o '^... .. ..:..' | uniq -c

(将第二位调整为您希望频率细分的粒度)。


毫无疑问,我是反对潮流的小鱼,但我认为bash是可憎的.....(鸭跑!)认真地说,每次我尝试使用它,都会使我的生活痛苦不堪-而不是ksh-兼容。我在bash中执行的第一个命令之一是“ exec ksh -o vi”,(通常)对其进行了修复。

不必要。这并不是对bash的特别热爱,而是让我继续bash的足够好和无处不在的因素。就个人而言,我认为ksh是一个好的脚本shell,但不是一个好的交互shell。我知道您可以从技术上在ksh中完成可编程完成,但是与bash或zsh完成相比,它有点麻烦,而且我不知道ksh相当于bash完成项目。(哦,您也可以在bash中设置-o vi)。
罗布·尚特

频率分析非常棒,cut -c1-12只要所有行都有严格的数据格式,就可以始终使用grep 进行分析,甚至比grep 更简单-通常对于syslog文件而言是正确的。
菲利克斯·弗兰克

5

当您需要窥视机柜/服务器机箱/在活动地板下等时,最好使用带有新鲜电池的Minimag手电筒。


1
或者是一种便宜的LED灯泡,当您将其摔落时不会损坏灯泡,并且使用寿命长。或售价65美元的高档LED,其亮度从暗(8流明,以天为单位的运行时间)到致盲(215流明)可变。但这可能太过分了。
罗纳德·帕托

现在,Maglite制作了自己的LED灯,并且比标准灯亮得多。
Joe Internet,2010年

4

因素是特别喜欢的。

它通常仅被视为较大的Puppet配置管理框架的一部分,但其自身非常有用;提供一致的跨平台方式来查找核心系统信息。本质上来说,外壳脚本很棒。

例如:

  事实操作系统=> ubuntu
  事实lsbdistcodename =>哈迪
  事实域=> mydnsdomain.com

扩展您自己(或其他人)的“事实”也很容易,例如:

  事实local_postgresql_port => 5434
  事实has_hardware_raid => LSI

4

我将使用一个黑客工具,该工具可能对诊断故障也很有用:该隐。它可以嗅探网络并在网络上进行很多攻击(arp中毒,中间人等),以及破坏(或恢复)密码。

有什么更好的方式来了解您的网络是安全的。


4

视窗

尽管所有SysInterals工具都很棒,但对我帮助最大的工具监视工具

最好还是快速确定为什么某事不起作用。

(* Regmon和Filemon已集成到Process Monitor中,以用于更新的Windows版本)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.