Questions tagged «text-processing»

通过程序,脚本等操作或检查文本


5
从数据文件中随机绘制一定数量的线
我有一个数据列表,例如 12345 23456 67891 -20000 200 600 20 ... 假设此数据集的大小(即文件行)为N。我想m从此数据文件中随机绘制线条。因此,输出应该是两个文件,一个是包含这些m数据行的文件,另一个是包含数据行的文件N-m。 有没有办法使用Linux命令来做到这一点?

4
如何在AWK中使用正则表达式进行字符串替换?
假设文件中有一些文本: (bookmarks ("Chapter 1 Introduction 1" "#1" ("1.1 Problem Statement and Basic Definitions 23" "#2") ("Exercises 31" "#30") ("Notes and References 42" "#34")) ) 我想给每个数字加11,"如果有的话,则在每行中加一个,即 (bookmarks ("Chapter 1 Introduction 12" "#12" ("1.1 Problem Statement and Basic Definitions 34" "#13") ("Exercises 42" "#41") ("Notes and References 53" "#45")) ) 这是我使用GNU AWK和regex的解决方案: …


3
在(和排除)两个模式之间打印行
我将使用cURL提交表单,其中某些内容来自其他文件,使用 sed 如果使用param1来匹配其他文件的行匹配模式sed,则以下命令可以正常运行: curl -d param1="$(sed -n '/matchpattern/p' file.txt)" -d param2=value2 http://example.com/submit 现在,解决问题。我只想显示2个匹配模式之间的文本(不包括匹配模式本身)。 可以说file.txt包含: Bla bla bla firstmatch It is a long established fact that a reader will be distracted by the readable content of a page when looking at its layout. secondmatch The point of using Lorem Ipsum is …

2
按列排序输出
我想接受这个命令find -maxdepth 1 -type d | while read -r dir; do printf "%s:\t" "$dir"; find "$dir" | wc -l; done(从这里开始)。其输出基本上是 ./kennel: 11062 ./shadow: 15449 ./ccc: 9765 ./journeyo: 14200 ./norths: 10710 并按最大到最小的数字对其进行排序。但我不确定如何制作sort,或在其他专栏中进行任何操作。


6
使用awk重新排列列
我正在尝试通过使用将csv文件的第7列移至末尾 awk -F '{print $1,$2,$3,$4,$5,$6,$8,$9,$10,$11,$7}',OFS= "$file" 其中$ file是目录中的.csv文件。但是,输出是 awk: ^ syntax error 有人知道如何解决此错误吗?

5
如何从JSON文件提取数据
我有bin在寻找解决方案来解决我的问题,但找不到或更好的说我没有得到所找到的解决方案。因此,让我们谈谈我的问题是什么。我在Raspberry Pi上使用了智能家居控制软件,正如本周末我发现的那样,我可以使用pilight-receive来捕获室外温度传感器的数据。pilight-receive的输出如下所示: { "message": { "id": 4095, "temperature": 409.5 }, "origin": "receiver", "protocol": "alecto_wsd17", "uuid": "0000-b8-27-eb-0f3db7", "repeats": 3 } { "message": { "id": 1490, "temperature": 25.1, "humidity": 40.0, "battery": 1 }, "origin": "receiver", "protocol": "alecto_ws1700", "uuid": "0000-b8-27-eb-0f3db7", "repeats": 3 } { "message": { "id": 2039, "temperature": 409.5 }, "origin": "receiver", …


7
如何对.bib文件中的BibTex条目进行排序(按任何键)?
我使用LaTeX,并使用Gi​​t进行版本控制。对于书目管理,我使用Mendeley。 问题在于,每次Mendeley同步其.bib出口时,它们的输出顺序都不同,这使书目版本控制变得更加困难。 我的想法是.bib每次提交前对文件中的BibTex条目进行排序。 您能帮我吗,如何以灵巧(简短)的方式做到这一点?:) PS我可以手动运行此例程。我不需要git集成。我只希望程序/脚本对.bib文件进行排序。


4
从CSV文件中删除重复的条目
我有一个[csv]文件,该文件具有重复的重复数据,即相同的数据打印了两次。我试过使用sort的uniq ,sort myfile.csv | uniq -u但是中没有变化myfile.csv,我也试过sudo sort myfile.csv | uniq -u但没有区别。 所以目前我的csv文件看起来像这样 a a a b b c c c c c 我想看起来像 a b c

3
计数记录与Awk的匹配模式
因此,我被告知要做的last > lastloggedin是创建一个文件,该文件显示自上次系统重新引导以来最后一次登录的类。现在,我被要求编写一个Awk脚本,该脚本的名称myawk可以计算/确定lastloggedin包含该字符串的行 数CFS264。 我已经搞定了 grep -c CFS264 lastloggedin

2
用零替换缺失值空白
我有大约30K行的制表符分隔文本文件input.txt,我想检查每行(s1..s30K行)是否有缺失值(即空白),并用零值填充缺失值。请参见out.txt input.txt id no1 no2 no3 no4 s1 23 34 45 12 s2 4 4 s3 4 8 0 out.txt id no1 no2 no3 no4 s1 23 34 45 12 s2 0 4 4 0 s3 4 0 8 0

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.