Questions tagged «text-processing»

通过程序,脚本等操作或检查文本


10
文本处理-每两行用逗号连接
我的文件中有1000多行。该文件开始如下(添加行号): Station Name Station Code A N DEV NAGAR ACND ABHAIPUR AHA ABOHAR ABS ABU ROAD ABR 我需要将其转换为文件,并通过每两行连接以逗号分隔的条目。最终数据应如下所示 Station Name,Station Code A N DEV NAGAR,ACND ABHAIPUR,AHA ABOHAR,ABS ABU ROAD,ABR ... 我正在尝试的是-尝试编写Shell脚本,然后echo在两者之间加逗号。但我想更简单有效的一行将在这里做的工作可能在sed/ awk。 有任何想法吗?

8
从底部向上看日志
是否有Linux命令或某种方式可以从下至上而不是从上至下查看日志。我知道tail -n <number of lines>,但是实际上我可以滚动并从下往上滚动吗?


1
Vim:使XML文本“漂亮”
有没有一种简单的方法vi可以使您的XML文本“漂亮”? 例如: 我要这个.. <person> <name>Nick</name> <age>26</age> <gender>male</gender> <occupation>doctor</occupation> </person> 成为这个... <person> <name>Nick</name> <age>26</age> <gender>male</gender> <occupation>doctor</occupation> </person>

3
如何基于两列的匹配合并两个文件?
我有喜欢的文件: 0 AFFX-SNP-000541 NA 0 AFFX-SNP-002255 NA 1 rs12103 0.6401 1 rs12103_1247494 0.696 1 rs12142199 0.7672 和一个file2: 0 AFFX-SNP-000541 1 0 AFFX-SNP-002255 1 1 rs12103 0.5596 1 rs12103_1247494 0.5581 1 rs12142199 0.4931 并且想要一个file3这样的: 0 AFFX-SNP-000541 NA 1 0 AFFX-SNP-002255 NA 1 1 rs12103 0.6401 0.5596 1 rs12103_1247494 0.696 0.5581 1 …

4
如何在文件末尾删除换行符?
让我清除换行符: $ echo Hello > file1 ; cat file1 Hello $ echo -n Hello > file2 ; cat file2 Hello$ 在这里,您可以看到file1结尾处有换行符,而结尾file2没有。 现在假设我有一个file: $ cat file Hello Welcome to Unix $ 我想and Linux在文件末尾添加,然后echo " and Linux" >> file将其添加到换行符。但我要最后一行Unix and Linux 因此,为了变通,我想在文件末尾删除换行符。因此,如何删除文件末尾的换行符?

4
删除文件的前n个字节
我遇到了一个极端的问题,我能想到的所有解决方案都很复杂。根据我的UNIX / Linux经验,必须有一种简单的方法。 我想删除中每个文件的前31个字节/foo/。每个文件足够长。好吧,我敢肯定有人会为我提供一个我无法想象的超简单解决方案。也许awk?


2
是否存在用于在CSV文件中删除列的命令行拼写?
具有以下内容的文件: 1111,2222,3333,4444 aaaa,bbbb,cccc,dddd 我试图得到一个与原始文件相等但缺少第n列的文件,例如n = 2(或者可能是3) 1111,2222,4444 aaaa,bbbb,dddd 或,对于n = 0(或可能为1) 2222,3333,4444 bbbb,cccc,dddd 实际文件的长度可以为千兆字节,具有数万列。 和以往一样,我怀疑命令行魔术师可以提供一个优雅的解决方案... :-) 在我实际的实际情况中,我需要删除2个第一列,这可以通过按顺序删除第一列两次来完成,但是我想概括一下会更有趣。

3
如何在文本文件中找到不匹配的括号?
今天,我了解到可以用来perl -c filename在任意文件(不一定是Perl脚本)中找到不匹配的大括号{}。问题是,它不能与其他类型的方括号()[]以及<>一起使用。我还对几个Vim插件进行了实验,这些插件声称可以帮助您找到无与伦比的括号,但到目前为止还不是很好。 我有一个带有很多括号的文本文件,其中一个缺少!是否有任何程序/脚本/ vim插件/可以帮助我识别出无与伦比的括号?

10
如何在模式(标记)之前将文件的内容插入另一个文件?
File1 内容: line1-file1 "1" line2-file1 "2" line3-file1 "3" line4-file1 "4" File2 内容: line1-file2 "25" line2-file2 "24" Pointer-file2 "23" line4-file2 "22" line5-file2 "21" 执行完perl / shell脚本后,File2内容应变为: line1-file2 "25" line2-file2 "24" line1-file1 "1" line2-file1 "2" line3-file1 "3" line4-file1 "4" Pointer-file2 "23" line4-file2 "22" line5-file2 "21" 即,将File1in 的内容粘贴在File2包含“ Pointer”的行之前。


5
如何用awk替换特定列的内容?
给定:一条记录​​中有40列。我想替换第35列,以便将第35列替换为第35列的内容和“ $”符号。我想到的是: awk '{print $1" "$2" "...$35"$ "$36...$40}' 它可以工作,但是因为当列数最大为10k时不可行。我需要一个更好的方法来做到这一点。

2
计算文本文件中单词的出现次数
我有一个包含推文的文本文件,我需要计算推文中提到一个单词的次数。例如,文件包含: Apple iPhone X is going to worth a fortune The iPhone X is Apple's latest flagship iPhone. How will it pit against it's competitors? 假设我想计算文件中提到iPhone一词的次数。这就是我尝试过的。 cut -f 1 Tweet_Data | grep -i "iPhone" | wc -l 它当然可以工作,但是我对UNIX中的“ wc”命令感到困惑。如果尝试以下操作,有什么区别: cut -f 1 Tweet_Data | grep -c "iPhone" 在哪里使用-c代替?在一个充满推文的大文件中,这两种方法都产生不同的结果,我对其工作方式感到困惑。正确的计数方法是哪种?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.