Answers:
使用wc(GNU coreutils)7.4:
wc -L filename
给出:
101 filename
-L
取决于语言环境。有些字符(在字节和多字节意义上)甚至可能根本不算在内!
wc: illegal option -- L usage: wc [-clmw] [file ...]
gwc
在coreutils
公式中,该公式将安装所有带有g
前缀的GNU coreutils 。
awk '{print length, $0}' Input_file |sort -nr|head -1
供参考:查找文件中最长的行
END{}
块中打印出来。
awk '{ if (length($0) > max) {max = length($0); maxline = $0} } END { print maxline }' YOURFILE
awk '{ if (length($0) > max) max = length($0) } END { print max }' YOURFILE
awk 'length>max{max=length}END{print max}' file
awk '{ if (length($0) > max) {max = length($0); maxline = $0} } END { print maxline }' YOURFILE | wc -c
纯粹出于娱乐和教育目的,纯POSIX shell解决方案,无需浪费时间使用cat,也无需派生使用外部命令。将filename作为第一个参数:
#!/bin/sh
MAX=0 IFS=
while read -r line; do
if [ ${#line} -gt $MAX ]; then MAX=${#line}; fi
done < "$1"
printf "$MAX\n"
< "$1"
它,可以很容易地从标准输入中读取。对其进行测试$#
甚至可以同时完成这两个操作,具体取决于args的数量。在这个世界上,没有必要的是无用的猫。应该从一开始就对新手进行相应的培训。
longest < /usr/share/dict/words
perl -ne 'print length()." line $. $_"' myfile | sort -nr | head -n 1
打印长度,行号和最长行的内容
perl -ne 'print length()." line $. $_"' myfile | sort -n
打印所有行的排序列表,包括行号和长度
.
是连接运算符-在length()
$.
是当前行号
$_
是当前行之后在此处使用
wc -L
到目前为止,是我看到的最好的解决方案。
wc -L
花费了3秒
wc -L
只是计数数字记录-这个Q将要找到最长的行-不太一样,所以这不是准确的比较。
在上述示例中,重要的一点被忽略了。
以下2个示例计算扩展标签
wc -L <"${SourceFile}"
# or
expand --tabs=8 "${SourceFile}" | awk '{ if (length($0) > max) {max = length($0)} } END { print max }'
以下2个计数未展开的标签。
expand --tabs=1 "${SourceFile}" | wc -L
# or
awk '{ if (length($0) > max) {max = length($0)} } END { print max }' "${SourceFile}"
所以
Expanded nonexpanded
$'nn\tnn' 10 5
看起来所有答案都没有给出最长的线的行号。以下命令可以给出行号和大致长度:
$ cat -n test.txt | awk '{print "longest_line_number: " $1 " length_with_line_number: " length}' | sort -k4 -nr | head -3
longest_line_number: 3 length_with_line_number: 13
longest_line_number: 4 length_with_line_number: 12
longest_line_number: 2 length_with_line_number: 11
awk '{print length}' test.txt | sort -rn | head -1
。如果您也需要实际行的内容,则 awk '{print length,$0}' test.txt | sort -k1 -rn| head -1
只是为了好玩,这是Powershell版本:
cat filename.txt | sort length | select -last 1
并获得长度:
(cat filename.txt | sort length | select -last 1).Length
sort
使用filename.txt作为参数吗?那只猫就没用了,因为sort length filename.txt | select -last 1
避免了仅复制数据的管道和进程。
我在Unix环境中,使用大小为GB的压缩文件。我使用2 GB压缩文件(记录长度为2052)测试了以下命令。
zcat <gzipped file> | wc -L
和
zcat <gzipped file> | awk '{print length}' | sort -u
时代在变
117秒
109秒
这是大约运行10次后的脚本。
START=$(date +%s) ## time of start
zcat $1 | wc -L
END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"
START=$(date +%s) ## time of start
zcat $1 | awk '{print length}' | sort -u
END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"
awk
版本会从wc
首先运行的版本的磁盘块缓存中受益(并为磁盘缓存添加种子)。您将不得不随机分配谁在十次运行中首先被调用的顺序,以使该参数生效。
如果您使用的是MacOS,但出现此错误:
wc: illegal option -- L
您不需要安装GNU即可。
如果您只想获取文件最长行中的字符数,并且您正在使用OS X,请运行:
awk '{print length}' "$file_name" | sort -rn | head -1
像这样的东西;
echo "The longest line in the file $file_name has $(awk '{print length}' "$file_name" | sort -rn | head -1) characters"
输出:
The longest line in the file my_file has 117 characters
-c -l -m -w
选项是POSIX。-L
是GNUism。