Questions tagged «text-processing»

通过程序,脚本等操作或检查文本





4
以多种表达方式进行就地辩论
我正在尝试通过使用替换文件中的多个单词 sed -i #expression1 #expression2 文件 Something 123 item1 Something 456 item2 Something 768 item3 Something 353 item4 输出(所需) anything 123 stuff1 anything 456 stuff2 anything 768 stuff3 anything 353 stuff4 试用 我可以使用sed -i2次获得以下输出。 sed -i 's/Some/any/g' file sed -i 's/item/stuff/g' file 我可以用任何可能的方式使它成为单个就地命令吗? sed -i 's/Some/any/g' -i 's/item/stuff/g' file 当我尝试上述代码时,它将s/item/stuff/g作为文件并尝试对其进行处理。

9
显示文件的前几行和后几​​行的命令
我有一个包含很多行的文件,每行的开头都有一个时间戳,例如 [Thread-3] (21/09/12 06:17:38:672) logged message from code..... 因此,我经常检查此日志文件中的2件事。 还给出了具有全局条件和开始时间的前几行。 最后几行具有退出状态以及其他一些信息。 是否有任何方便的单个命令可以让我仅显示文件的前几行和后几​​行?

4
如何在Shell中解析数​​百个html源代码文件?
我有数百个html源代码文件。我需要<div>从每个文件中提取特定元素的内容,因此我将编写一个脚本来遍历每个文件。元素结构如下: <div id='the_div_id'> <div id='some_other_div'> <h3>Some content</h3> </div> </div> 谁能建议我the_div_id一种使用linux命令行从文件中提取div 以及所有子元素和内容的方法?

1
重用rsync --dry-run输出以加快稍后的实际传输速度
我通常rsync -n在做实际的事情前就做过rsync。问题是,我如何才能使第二轮运行自动化以完全重复使用生成的列表--dry-run? 我的意思是,如果我运行了,rsync -n然后得到了rsync将要执行的模拟操作,我的想法是获取该输出,对其进行处理,然后以某种方式rsync仅生成--include-from该输出,因此完整列表仅需计算一次。 如果这甚至没有道理,请告诉我。 顺便说一下,我倾向于使用rsync -hva --progress --stats --delete --exclude-from "$EXCLUDEFILE"。如果您对使用什么选项也有建议,请告诉我。我正在尝试将外部硬盘驱动器(仅包含图像,视频和文档)的内容复制到另一个外部硬盘驱动器。

5
如何报告“ sed”就地变更
在sed用于就地替换字符串时,是否有办法使其报告所做的更改(不依赖于新旧文件的差异)? 例如,如何更改命令行 find . -type f | xargs sed -i 's/abc/def/g' 这样我就可以看到正在进行的更改?


7
两个标签之间的文字
我想<tr> </tr>从html文档中检索这两个标签之间的任何内容。现在,我没有任何特定的html要求可以保证html解析器。我只是简单地需要一些匹配的东西,<tr>并</tr>在两者之间获取所有内容,并且可能会有多个trs。我尝试了awk,它可以工作,但是由于某种原因,它最终给了我提取的每一行的副本。 awk ' /<TR/{p=1; s=$0} p && /<\/TR>/{print $0 FS s; s=""; p=0} p' htmlfile> newfile 怎么办呢?

1
如何将日期和时间放在文件名中?
我正在尝试执行命令,并希望将日期和时间放在输出文件名中。 这是我要运行的示例命令。 md5sum /etc/mtab > 2016_4_25_10_30_AM.log 日期时间格式可以是带下划线的任何有意义的内容。如果无法使用AM和PM,则即使是UTC。

7
仅在逗号分隔文件中删除引号之间的逗号
我有一个用逗号(,)分隔的输入文件。有一些用双引号引起来的字段,其中用逗号分隔。这是示例行 123,"ABC, DEV 23",345,534.202,NAME 我需要删除所有在双引号和双引号内出现的逗号。所以上面的行应该解析成如下图所示 123,ABC DEV 23,345,534.202,NAME 我尝试使用以下方法sed,但未给出预期的结果。 sed -e 's/\(".*\),\(".*\)/\1 \2/g' 任何快速的运用了sed,awk或者任何其他Unix工具吗?
23 text-processing  sed  awk  csv 


5
如何使用cut分隔多个空格?
我想获得此示例的最后一列: [ 3] 1.0- 2.0 sec 1.00 MBytes 8.39 Mbits/sec [ 3] 2.0- 3.0 sec 768 KBytes 6.29 Mbits/sec [ 3] 3.0- 4.0 sec 512 KBytes 4.19 Mbits/sec [ 3] 4.0- 5.0 sec 256 KBytes 2.10 Mbits/sec ... 如果我用 cut -d\ -f 13 我懂了 Mbits/sec 6.29 4.19 2.10 因为有时它们之间还有其他空格。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.