Questions tagged «sort»

对文本文件或其他数据进行排序,例如使用sort实用程序。

6
获取所有单词的文本文件单词出现次数并按打印输出排序
我有一个可以处理文本文件的命令,可以计算单词的所有出现次数,并像这样打印出来: user@box $˜ magic-command-i-forgot | with grep | and awk | sort ./textfile.txt 66: the 54: and 32: I 16: unix 12: bash 5: internet 3: sh 1: GNU/Linux 因此,它不是逐行搜索,而是逐词搜索,并且它针对所有单词(不仅针对1个单词)进行搜索。我很久以前在互联网上的某个地方找到了它,但我找不到或记住它。
28 sort 


3
为什么排序说ɛ= e?
ɛ(“拉丁字母epsilon”)是某些非洲语言中使用的字母,通常代表英语“ bed”中的元音。在Unicode中,它的编码为U + 025B,与日常的非常不同e。 但是,如果我sort以下内容: eb ed ɛa ɛc 似乎sort考虑ɛ和e等效: ɛa eb ɛc ed 这里发生了什么?而且是有办法让ɛ和e独特的sort荷兰国际集团的目的呢?
25 sort  locale  unicode 

2
为什么ls排序会忽略非字母数字字符?
在对文件名进行排序时,请ls忽略诸如之类的字符-,_。我希望它也可以使用这些字符进行排序。 一个例子: touch a1 a2 a-1 a-2 a_1 a_2 a.1 a.2 a,1 a,2 现在显示以下文件ls -1: a1 a_1 a-1 a,1 a.1 a2 a_2 a-2 a,2 a.2 我所期望的是这样的: a1 a2 a,1 a,2 a.1 a.2 a_1 a_2 a-1 a-2 即我希望排序时要考虑非字母数字字符。 谁能解释这种行为?此行为是由标准强制执行的吗?还是因为编码为UTF-8? 更新:看来这与UTF-8排序有关: $ LC_COLLATE=C ls -1 a,1 a,2 a-1 a-2 a.1 a.2 a1 …
25 ls  sort 

3
'sort -u'对于大型文件的可伸缩性
'sort -u'的合理可伸缩性限制是多少?(以“行长”,“行数”,“文件总大小”为单位?) 对于超出“行数”维的文件,Unix的替代方案是什么?(当然,我可以轻松实现一个,但是我想知道是否可以用很少的标准Linux命令来完成某些工作?)
23 sort 

1
如何按最后一列数字排序?
我有这个输入: sdkxyosl 1 safkls 2 asdf--asdfasxy_asd 5 dkd8k jasd 29 sdi44sw 43 asasd afsdfs 10 rklyasd 4 我需要以下输出: sdi44sw 43 dkd8k jasd 29 asasd afsdfs 10 asdf--asdfasxy_asd 5 rklyasd 4 safkls 2 sdkxyosl 1 所以我需要按最后一列对行进行排序。 我不知道一行中有多少列。 我只是想不通,怎么做。我没有“ perl权力”。我只有sed,awk,cut等的平均脚本能力。 有人知道怎么做吗?

1
以第一列的降序对数据进行排序,对于相等的值,以升序使用第二列
请允许我澄清一下: 假设我有一些关键字,它们的使用频率如下: 12 Hi 7 Hash 7 C++ 9 Superuser 17 Stackoverflow 9 LaTeX 42 Life 9 Ubuntu 我想要的是根据频率以降序对数据进行排序,如果有一些相等的值,则应该以升序使用第二列。 sort -n -r foo.txt 第一部分而不是第二栏是否也是reversed: 42 Life 17 Stackoverflow 12 Hi 9 Ubuntu 9 Superuser 9 LaTeX 7 Hash 7 C++ 如何获得以下结果? 42 Life 17 Stackoverflow 12 Hi 9 LaTeX 9 …

3
为什么coreutils的排序速度比Python慢​​?
我编写了以下脚本来测试Python排序功能的速度: from sys import stdin, stdout lines = list(stdin) lines.sort() stdout.writelines(lines) 然后,我将其与sort包含1000万行的文件中的coreutils 命令进行了比较: $ time python sort.py <numbers.txt >s1.txt real 0m16.707s user 0m16.288s sys 0m0.420s $ time sort <numbers.txt >s2.txt real 0m45.141s user 2m28.304s sys 0m0.380s 内置命令使用了所有四个CPU(Python仅使用了一个),但是运行时间大约是它的3倍!是什么赋予了? 我正在使用Ubuntu 12.04.5(32位),Python 2.7.3和sort8.13

4
如何使ls先排序下划线字符?
我希望能够使用下划线前缀来命名文件和目录,因为这是我想与同一级别的其他文件和目录分开的原因。例如,在Windows和Mac上,在文件前加下划线前缀会将其排在顶部,并以字母数字字符开头。 我的谷歌搜索发现它与LC_COLLATE和当前的语言环境(en_US)有关。很好,尽管我真的不明白为什么en_US不能按预期排序。 基于ICU Collat​​e演示站点,将语言环境设置为en_US_POSIX肯定符合我要查找的排序顺序(您必须编辑示例数据并添加一些下划线进行测试)。但是我真的没有看到如何在我的Linux shell中应用它。 理想情况下,我希望能够在我的bash配置中进行设置,以便ls始终首先对下划线进行排序。我将如何去做呢?
20 ls  sort  locale 

2
当排序不知道排序顺序时,GNU排序稳定排序
我有一个两栏的文件;该文件已经按照我想要的方式在第1列上进行了排序。我想对每个列1类别中的列2进行排序。但是,sort不了解第1列的排序顺序。 正常的方式(来自栈上类似的问题)是这样的: sort --stable -k1,1 -k2,2n 但是我无法在k1上指定排序,因为它是任意的。 输入示例: C 2 C 1 A 2 A 1 B 2 B 1 并输出: C 1 C 2 A 1 A 2 B 1 B 2
18 sort 

1
目录列表未完全排序
我在Debian Linux系统上有以下目录清单。但是,奇怪的是,文件populate.sql似乎没有与其余文件一起排序。 -rw-r--r-- 1 user1 user1 10004 Jul 28 13:16 populate2.sql -rw-r--r-- 1 user1 user1 10244 Jul 28 13:16 populate3.sql -rw-r--r-- 1 user1 user1 10359 Jul 28 13:16 populate4.sql -rw-r--r-- 1 user1 user1 11618 Jul 28 13:16 populate5.sql -rw-r--r-- 1 user1 user1 11654 Jul 28 13:17 populate6.sql -rw-r--r-- 1 user1 …

5
如何对具有major.minor.patch级别的列表进行排序,有时还可以正确地对rc进行排序?
我必须使用shell脚本对以下列表进行排序,并使最新版本显示在底部或顶部。我将如何仅使用Shell工具来做到这一点? release-5.0.0.rc1 release-5.0.0.rc2 release-5.0.0 release-5.0.1 release-5.0.10 release-5.0.11 release-5.0.13 release-5.0.14 release-5.0.15 release-5.0.16 release-5.0.17 release-5.0.18 release-5.0.19 release-5.0.2 release-5.0.20 release-5.0.21 release-5.0.22 release-5.0.23 release-5.0.24 release-5.0.25 release-5.0.26 release-5.0.27 release-5.0.28 release-5.0.29 release-5.0.3
18 shell-script  awk  sed  python  sort 


3
ps命令的CPU字段如何排序?
我正在尝试执行一条小命令,以查找使用最多CPU能力的进程。 首先,我使用ps aux > file.txt然后cut -c 16-20 file.txt | sort -n | tail -5。 我得到的结果是这样的: 1.0 2.7 8. 14.5 14.5 所以我的问题是如何将%CPU用法和其他字段一起输出?
18 bash  shell-script  sort  ps 

3
Linux排序的默认顺序是什么?
长期以来,我认为程序的默认行为sort是使用ASCII顺序。但是,当我输入以下行时sort不带任何参数: # @ 我有: @ # 但是根据ASCII表,分别#是35和@64。另一个示例是: A a 输出为: a A 有人可以解释吗?顺便说一句,使用时的“字典顺序”是什么sort -d?
18 linux  sort  locale 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.