cut
今天使用时,我发现它不会将UTF-8字符视为字符,而是3个字符,因为它的长度为3个字节。
对于许多工具来说,这似乎通常是正确的。
是否有支持coreutils
UTF-8的版本?
我的locale
输出:
LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=
这是什么时候cut
不起作用
echo 哈哈 | cut -c 2-
��哈
正确的输出应该是
哈
如果cut -c
使用多字节字符。
我已经更新了语言环境。
—
赵超
好的,您还可以添加一些
—
Alex
cut
命令行示例吗?
可以在Ubuntu 10.04上使用
—
maxschlepzig
echo ßßßß | cut -c 2-
-> �ßßß
(LANG=en_US.UTF-8
)
可悲的是,三年后,在Ubuntu 13.10中仍然如此……
—
Mike
locale
正确吗?什么是的读数locale
(W / O参数)命令调用?