Questions tagged «filter»

7
程序将STDIN传递到STDOUT并去除了颜色代码?
我有一个产生彩色输出的命令,我想将其通过管道输出到一个去除了颜色代码的文件中。cat除了剥离颜色代码外,是否有其他类似的命令?我计划做这样的事情: $ command-that-produces-colored-output | stripcolorcodes > outfile
64 colors  pipe  filter 


9
如何打印文件中最长的行?
我正在寻找最简单的方法来打印文件中的最长行。我做了一些谷歌搜索,令人惊讶的是似乎找不到答案。我经常打印文件中最长行的长度,但是我不知道如何实际打印最长行。任何人都可以提供一种解决方案来打印文件中最长的行吗?提前致谢。
35 bash  awk  filter 

1
隐藏基于多种图案的线
我less经常查看日志文件,每隔一段时间我想通过隐藏包含一些关键字的行来过滤输出。 在less有可能与过滤出布线&!<keyword>但每次只适用于一个关键词。我想指定要过滤掉的关键字列表。这是可能吗?
23 logs  less  filter 

6
Unix shell“ stdin / stdout API”的稳定性如何?
grepping,awking,sedding和管道是任何类Unix操作系统的用户的日常例行程序,可能是在命令行中还是在shell脚本中(从现在起统称为过滤器)。 从本质上讲,当使用“标准” Unix CLI程序和Shell内置程序(从现在起统称为命令)时,过滤器需要在每个过滤器步骤中为stdin,stdout和stderr提供精确的预期格式,以使其正常工作。在下文中,我将某些命令的这种精确的预期格式称为该命令的API。 作为具有Web开发背景的人,我将这种数据收集和数据处理技术与Web抓取进行了比较 -这种技术在数据呈现方式发生最小变化时就非常不稳定。 我的问题现在与Unix命令API的稳定性有关。 类似Unix的操作系统中的命令是否在输入和输出方面遵循正式的标准? 历史上是否存在某些实例,其中一些重要命令的更新导致使用该命令的较早版本构建的某些过滤器的功能中断? Unix命令是否已经随着时间而成熟,以至于绝对不可能以某种过滤器可能损坏的方式进行更改? 如果由于更改命令API导致过滤器不时损坏的情况,作为开发人员,我如何保护我的过滤器免受此问题的影响?

10
按行号过滤文件
给定一个文件L,每行一个非负整数,并且文本文件F,那么仅将行号出现在文件L中的那些行保留在F中的快速方法是什么? 例: $ cat L.txt 1 3 $ cat F.txt Hello World Hallo Welt Hola mundo $ command-in-question -x L.txt F.txt Hello World Hola mundo 我正在寻找一个可以处理具有5亿或更多条目的文件L的命令;文件L按数字排序。 注意:我已经完成了的实现的一半,command-in-question但是我只是想知道,这里是否也可以使用某些Unix工具。 更新:感谢您提供所有答案,我今天学到了很多东西!我想接受一个以上的答案,但这是不可能的。

3
根据文件的第5列值过滤.CSV文件,并将这些记录打印到新文件中
我有一个.CSV文件,格式如下: "column 1","column 2","column 3","column 4","column 5","column 6","column 7","column 8","column 9","column 10 "12310","42324564756","a simple string with a , comma","string with or, without commas","string 1","USD","12","70%","08/01/2013","" "23455","12312255564","string, with, multiple, commas","string with or, without commas","string 2","USD","433","70%","07/15/2013","" "23525","74535243123","string , with commas, and - hypens and: semicolans","string with or, without commas","string 1","CAND","744","70%","05/06/2013","" "46476","15467534544","lengthy string, with …
16 linux  sed  awk  csv  filter 

6
列出与文件名中给定字符串不匹配的文件
我有一个目录,在其中创建了很多文件(大约200个),该文件的名称temp_log.$$带有其他一些我需要检查的重要文件。 如何轻松列出所有文件并temp_log.$$从显示中排除文件? 预期产量 $ ls -lrt <exclude-filename-part> -- Lists files not matching the above given string 我浏览了ls手册页,但在此参考资料中找不到任何内容。如果我错过了任何重要信息,请告诉我。 谢谢
16 ls  filter 


7
如何从文件中删除多个空白行?
我有一些用于记笔记的文本文件-纯文本,通常仅使用cat >> file。有时我使用一两行空白(仅返回-换行符)来指定新的主题/思路。在每个会话结束时,在用Ctrl+ 关闭文件之前D,我通常添加很多(5-10)空行(返回键)以分隔会话。 这显然不是很聪明,但是它对我有用。我做不过最终了很多很多不必要的空行,所以我在寻找一种方式来删除(大部分)的额外线。是否有Linux命令(剪切,粘贴,grep,...?)可以直接与几个选项一起使用?或者,是否有人对sed,awk或perl(可以在任何脚本语言中使用,尽管我更喜欢sed或awk)的脚本都能满足我的需求?用C ++编写某些东西(我实际上可以自己做),似乎有点过头了。 情况1:我需要的是一个脚本/命令,该脚本/命令将删除多于两个(3个或更多)连续的空行,并将其替换为仅两个空行。尽管也可以对其进行调整以删除多于一行(两行或更多)和/或仅用一个空白行替换多个空白行,这是很好的。 情况2:我还可以使用脚本/命令来删除两行文本之间的单个空白行,但照原样保留多个空白行(尽管删除其中一个空白行也是可以接受的)。
14 scripting  sed  awk  perl  filter 

2
按颜色过滤命令输出
我正在运行的实用程序没有提供过滤其输出的方法。输出文本中没有任何内容表明特定功能失败,但确实显示为红色。输出是如此之长,以至于当它报告一些错误时最后,我不能总是滚动查看发生错误的输出。 如何过滤出非红色文本? 伪代码: dolongtask | grep -color red 编辑 该命令也会输出其他颜色,我需要能够过滤掉所有非红色的文本。文本着色也是多行的。
13 grep  colors  text  filter 

2
如何仅显示不匹配过滤器的进程?
我htop用来交互式地监视我的过程。 但是,有时某些进程会“阻碍”运行,我想将它们过滤掉。 不幸的是,似乎htop的内置过滤器(例如F4)仅允许我定义一个正过滤器(仅显示匹配项),而不是负过滤器(除匹配项之外的所有示例)。 最后,我还没有找到有关搜索字符串实际语法的任何文档(正则表达式似乎无效)。
12 filter  htop 

7
仅保留包含定界符确切数目的行
我有一个巨大的csv文件,其中10个字段用逗号分隔。不幸的是,某些行格式错误,并且不完全包含10个逗号(当我想将文件读入R时,这会引起一些问题)。如何仅过滤出恰好包含10个逗号的行?
9 csv  filter 

6
iptables阻止https网站
我希望在我的组织中阻止一些也运行基于https的网站,例如facebook,twitter和gmail。根据高级管理层的命令,不应在此处使用Squid。我们可以使用Untangle Lite Package和iptables。 除了Squid以外,还有其他选择吗?还有一些iptables规则可以阻止这种流量。 我找到了这个 iptables -t filter -I INPUT -m string --string facebook.com -j LOG --algo bm iptables -t filter -I INPUT -m string --string facebook.com -j REJECT --algo bm 但是https仍然可以在本地计算机以外的计算机上使用。

4
在给定字符串之前按字母顺序查找文件
如果我有一个充满文件和子目录的目录。仅列出按字母顺序位于给定字符串前的常规文件的最佳方法是什么? 目前,使用bash可以做的最好的事情如下: for x in `find . -maxdepth 1 -type f | sort` do if [[ "$x" > './reference' ]] then break fi echo $x done 我觉得有一种更简洁的方法可以执行此操作,但是我不确定它是什么。有任何想法吗?
8 bash  filter 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.