MySQL-length()与char_length()


215

length()和之间的主要区别是char_length()什么?

我相信这与二进制和非二进制字符串有关。是否有实际原因将字符串存储为二进制?

mysql> select length('MySQL'), char_length('MySQL');
+-----------------+----------------------+
| length('MySQL') | char_length('MySQL') |
+-----------------+----------------------+
|               5 |                    5 |
+-----------------+----------------------+
1 row in set (0.01 sec)

2
是的,当二进制字符串实际上是二进制字符串(例如压缩)时,有实际的原因要存储它们。
sanmai

Answers:


351

LENGTH()返回以字节为单位字符串长度。
CHAR_LENGTH()返回以字符为单位的字符串长度。

这与Unicode特别相关,在Unicode中,大多数字符都编码为两个字节。或UTF-8,其中字节数有所不同。例如:

select length(_utf8 '€'), char_length(_utf8 '€')
--> 3, 1

如您所见,0xE282AC即使只有一个字符,欧元符号也占用3个字节(按UTF-8 编码)。


6
每个字符只有UCS-2编码为两个字节。Windows误将这种编码(或更准确地说是UTF-16LE)称为“ Unicode”。MySQL不支持UTF-16。相反,将Unicode字符串放入其中的通常方法是使用UTF-8。
bobince

2
例如:选择length('日本语'),char_length('日本语');
sanmai

@bobince:例如,即使UCS-2也会以2个以上的字节编码某些字符0313 combining comma above。由于a = 61,因此0x00610313显示为a̓,并且占用4个字节。
安多玛尔

2
实际上,按照Unicode术语,它仍然是2个字符,即使像所有组合标记一样,也可以将其(如果有合适的字体可用)呈现为单个字形。由于代理,UTF-16LE仍然可以有4个字节的字符。
bobince

6
那么在确定如何调整VARCHAR列大小时应该使用以下哪个函数?创建表时,可以说一列是VARCHAR(10)。那会允许最多10个字符或最多10个字节吗?
still_dreaming_1 2014年

19

varchar(10)将存储10个字符,可能超过10个字节。在索引中,它将分配字段的最大长度-因此,如果您使用的是UTF8-mb4,它将为10个字符的字段分配40个字节。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.