Answers:
除了fedorqui的正确答案之外,我还要显示字符串长度和字节长度之间的区别:
myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
LANG=$oLang LC_ALL=$oLcAll
printf "%s is %d char len, but %d bytes len.\n" "${myvar}" $chrlen $bytlen
将呈现:
Généralités is 11 char len, but 14 bytes len.
您甚至可以查看存储的字符:
myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
printf -v myreal "%q" "$myvar"
LANG=$oLang LC_ALL=$oLcAll
printf "%s has %d chars, %d bytes: (%s).\n" "${myvar}" $chrlen $bytlen "$myreal"
会回答:
Généralités has 11 chars, 14 bytes: ($'G\303\251n\303\251ralit\303\251s').
Nota:根据Isabell Cowan的评论,我在和$LC_ALL
一起添加了设置$LANG
。
参数工作与常规变量相同
strLen() {
local bytlen sreal oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#1}
printf -v sreal %q "$1"
LANG=$oLang LC_ALL=$oLcAll
printf "String '%s' is %d bytes, but %d chars len: %s.\n" "$1" $bytlen ${#1} "$sreal"
}
将作为
strLen théorème
String 'théorème' is 10 bytes, but 8 chars len: $'th\303\251or\303\250me'
printf
校正工具:如果你:
for string in Généralités Language Théorème Février "Left: ←" "Yin Yang ☯";do
printf " - %-14s is %2d char length\n" "'$string'" ${#string}
done
- 'Généralités' is 11 char length
- 'Language' is 8 char length
- 'Théorème' is 8 char length
- 'Février' is 7 char length
- 'Left: ←' is 7 char length
- 'Yin Yang ☯' is 10 char length
不太漂亮 ...为此,有一个小功能:
strU8DiffLen () {
local bytlen oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#1}
LANG=$oLang LC_ALL=$oLcAll
return $(( bytlen - ${#1} ))
}
那么现在:
for string in Généralités Language Théorème Février "Left: ←" "Yin Yang ☯";do
strU8DiffLen "$string"
printf " - %-$((14+$?))s is %2d chars length, but uses %2d bytes\n" \
"'$string'" ${#string} $((${#string}+$?))
done
- 'Généralités' is 11 chars length, but uses 14 bytes
- 'Language' is 8 chars length, but uses 8 bytes
- 'Théorème' is 8 chars length, but uses 10 bytes
- 'Février' is 7 chars length, but uses 8 bytes
- 'Left: ←' is 7 chars length, but uses 9 bytes
- 'Yin Yang ☯' is 10 chars length, but uses 12 bytes
但是留下了一些奇怪的UTF-8行为,例如双行字符,零行字符,反向移位以及其他不那么简单的行为...
请查看diffU8test.sh或diffU8test.sh.txt以了解更多限制。
要获取存储在变量中的字符串的长度,请说:
myvar="some string"
size=${#myvar}
要确认已正确保存,请执行以下操作echo
:
$ echo "$size"
11
$rulename
其$RULE_PREFIX
前缀是否为: [ "${rulename:0:${#RULE_PREFIX}}" == "$RULE_PREFIX" ]
#myvar
and 的表达{#myvar}
吗?
${#parameter}
:替换参数扩展值的字符长度。
您可以使用:
MYSTRING="abc123"
MYLENGTH=$(printf "%s" "$MYSTRING" | wc -c)
wc -c
或wc --bytes
对于字节计数= Unicode字符以2、3或更多字节进行计数。wc -m
或wc --chars
字符计数= Unicode字符被单次计数,直到它们使用更多字节为止。mylen=$(printf "%s" "$HOME/.ssh" | wc -c)
遇到类似的问题,而被接受的解决方案将失败,您需要myvar=$HOME/.ssh
先进行操作。
如果要将此参数与命令行或函数参数一起使用,请确保使用size=${#1}
而不是size=${#$1}
。第二个可能更本能,但语法不正确。
size=${#1}
当然是有效的。
#
并没有取代$
- $
外括号仍然是扩展操作符。该#
是长度操作,一如既往。
这是几种计算变量长度的方法:
echo ${#VAR}
echo -n $VAR | wc -m
echo -n $VAR | wc -c
printf $VAR | wc -m
expr length $VAR
expr $VAR : '.*'
并将结果设置在另一个变量中,只需将上面带有反引号的命令分配给另一个变量,如下所示:
otherVar=`echo -n $VAR | wc -m`
echo $otherVar
http://techopsbook.blogspot.in/2017/09/how-to-find-length-of-string-variable.html