Questions tagged «text-processing»

机械化电子文本的创建或操纵。

22
如何从Unix上的文本文件中提取预定范围的行?
我有一个〜23000行的SQL转储,其中包含多个数据库数据。我需要提取此文件的某个部分(即单个数据库的数据)并将其放置在新文件中。我知道我想要的数据的开始和结束行号。 有谁知道Unix命令(或一系列命令)从文件中提取16224和16482行之间的所有行,然后将它们重定向到新文件中?



23
如何使用sed仅替换文件中的第一个匹配项?
我想在任何现有的#includes之前使用额外的include指令更新大量的C ++源文件。对于此类任务,我通常使用带有sed的小型bash脚本来重新写入文件。 如何sed仅替换文件中字符串的第一个匹配项而不是替换每个匹配项? 如果我用 sed s/#include/#include "newfile.h"\n#include/ 它替换了所有#includes。 也欢迎实现相同目标的替代建议。


7
在awk中使用多个定界符
我有一个包含以下行的文件: /logs/tc0001/tomcat/tomcat7.1/conf/catalina.properties:app.env.server.name = demo.example.com /logs/tc0001/tomcat/tomcat7.2/conf/catalina.properties:app.env.server.name = quest.example.com /logs/tc0001/tomcat/tomcat7.5/conf/catalina.properties:app.env.server.name = www.example.com 在上面的输出中,我想提取3个字段(Number 2、4和最后一个*.example.com)。我得到以下输出: cat file | awk -F'/' '{print $3 "\t" $5}' tc0001 tomcat7.1 tc0001 tomcat7.2 tc0001 tomcat7.5 我还如何提取域名之后的最后一个字段'='?如何multiple delimiter提取字段?


24
仍然有任何学习AWK的理由吗?
我一直在学习新的工具,甚至是老式的工具,因为我喜欢为问题使用正确的解决方案。 尽管如此,我想知道是否仍然有任何理由学习其中的一些。awk例如是对我有意思,但对于简单的文本处理,我可以使用grep,cut,sed等而复杂的,我会去为Python。 现在,我并不是说这不是一个强大而便捷的工具。但是由于学习新工具需要时间和精力,是否值得?



5
文本处理-Python vs Perl性能[关闭]
这个问题不太可能帮助将来的访客。它仅与较小的地理区域,特定的时间段或极为狭窄的情况(通常不适用于Internet的全球受众)有关。要获得使该问题更广泛适用的帮助,请访问帮助中心。 8年前关闭。 这是我的Perl和Python脚本,可以对大约21个日志文件进行一些简单的文本处理,每个日志文件大约300 KB到1 MB(最大)x重复5次(总共125个文件,由于日志重复了5次)。 Python代码(修改为使用已编译re和using的代码re.I) #!/usr/bin/python import re import fileinput exists_re = re.compile(r'^(.*?) INFO.*Such a record already exists', re.I) location_re = re.compile(r'^AwbLocation (.*?) insert into', re.I) for line in fileinput.input(): fn = fileinput.filename() currline = line.rstrip() mprev = exists_re.search(currline) if(mprev): xlogtime = mprev.group(1) mcurr = location_re.search(currline) if(mcurr): print fn, …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.