Answers:
只是为了清理...或总结...
nchar
并nvarchar
可以存储Unicode字符。char
并且无法存储Unicode字符。varchar
char
并且nchar
是固定长度的,即使您没有用完所有空间,它也会为您指定的字符数保留存储空间。varchar
并且nvarchar
是可变长度的,只会占用存储字符的空间。它不会保留char
或的存储空间nchar
。nchar
并且nvarchar
会占用两倍的存储空间,因此仅当需要Unicode支持时才使用它们可能是明智的。
n...
版本是否占用我的答案所示的
到目前为止,所有答案都表明varchar
是单字节,nvarchar
是双字节。这的第一部分实际上取决于整理,如下所示。
DECLARE @T TABLE
(
C1 VARCHAR(20) COLLATE Chinese_Traditional_Stroke_Order_100_CS_AS_KS_WS,
C2 NVARCHAR(20)COLLATE Chinese_Traditional_Stroke_Order_100_CS_AS_KS_WS
)
INSERT INTO @T
VALUES (N'中华人民共和国',N'中华人民共和国'),
(N'abc',N'abc');
SELECT C1,
C2,
LEN(C1) AS [LEN(C1)],
DATALENGTH(C1) AS [DATALENGTH(C1)],
LEN(C2) AS [LEN(C2)],
DATALENGTH(C2) AS [DATALENGTH(C2)]
FROM @T
退货
请注意,版本中仍不显示华
和国
字符,VARCHAR
而以静默替换?
。
实际上,在该排序规则中,单个字节不能代表任何汉字。唯一的单字节字符是典型的西方ASCII集。
因此,从nvarchar(X)
列到varchar(X)
列的插入可能会因截断错误而失败(其中X表示两个实例中的数字相同)。
SQL Server 2012添加了支持的SC(补充字符)排序规则UTF-16
。在这些归类中,单个nvarchar
字符可能占用2或4个字节。
nchar和char的操作几乎完全相同,nvarchar和varchar也是如此。它们之间的唯一区别是nchar / nvarchar存储Unicode字符(如果需要使用扩展字符集,则必须存储),而varchar则不存储。
因为Unicode字符需要更多的存储空间,所以nchar / nvarchar字段占用的空间是原来的两倍(例如,在早期版本的SQL Server中,nvarchar字段的最大大小为4000)。
这个问题是一个重复的这一个。
我试图总结和纠正现有答案:
首先,char
和nchar
将始终使用的存储空间固定量,即使当要被存储的字符串的长度超出可用的空间更小,而varchar
和nvarchar
如需要存储的字符串(加上开销的两个字节将只使用尽可能多的存储空间,大概存储字符串的长度)。因此请记住,在可变空间中,“ var”的意思是“变量”。
第二个主要的角度来理解的是,nchar
与nvarchar
使用存储字符串恰好每个字符用两个字节,而char
与varchar
使用由核对代码页确定的编码,这将通常是每个字符正好一个字节(尽管有例外,见下文)。通过每个字符使用两个字节,一个非常广泛的字符可以存储,所以要记住的基本的事情是,nchar
和nvarchar
往往是一个更好的选择,当你想要国际化的支持,你可能做的。
现在有一些更好的观点。
首先,nchar
和nvarchar
列始终使用UCS-2存储数据。这意味着每个字符将仅使用两个字节,并且“ nchar
或” nvarchar
字段可以存储基本多语言平面(BMP)中的任何Unicode字符。但是,并非可以存储任何 Unicode字符。例如,根据Wikipedia所述,埃及象形文字的代码点不在BMP之外。因此,存在可以用UTF-8表示的Unicode字符串以及不能存储在SQL Server nchar
或nvarchar
字段中的其他真正的Unicode编码,并且其中包括用埃及象形文字编写的字符串。幸运的是,您的用户可能没有用该脚本编写代码,但是请记住这一点!
另一种混乱,但有趣的一点,其他海报强调的是,char
和varchar
字段可能每个字符使用两个字节的某些字符当核对代码页需要它。(马丁史密斯给出了一个很好的例子,他展示了Chinese_Traditional_Stroke_Order_100_CS_AS_KS_WS表现出这种行为。
更新:从SQL Server 2012开始,终于有了UTF-16的代码页,例如Latin1_General_100_CI_AS_SC,它可以真正覆盖整个Unicode范围。
char
:固定长度的字符数据,最大长度为8000个字符。nchar
:固定长度的unicode数据,最大长度为4000个字符。Char
= 8位长度NChar
= 16位长度char
长度不能为8位。它不必存储长度,并且固定长度最多可以包含8000个字符。
nchar[(n)]
(民族字符)
n
定义字符串长度,并且必须是1到4,000之间的值。n
字节的两倍。nvarchar [(n | max)]
(民族字符各不相同。)
n
定义字符串长度,可以是1到4,000之间的值。max
表示最大存储大小为2 ^ 31-1字节(2 GB)。char [(n)]
(字符)
non-Unicode
字符串数据。n
定义字符串长度,并且必须是1到8,000之间的值。n
字节。varchar [(n | max)]
(字符不同)
n
定义字符串长度,可以是1到8,000之间的值。max
表示最大存储大小为2 ^ 31-1字节(2 GB)。nchar 比 nvarchar 需要更多空间。
例如,
即使您仅输入5,nchar(100)仍将始终存储100个字符,其余的95个字符将用空格填充。在nvarchar(100)中存储5个字符将保存5个字符。
nchar(10)是长度为10的固定长度Unicode字符串。nvarchar(10)是最大长度为10的可变长度Unicode字符串。通常,如果所有数据值均为10个字符,则使用前者,而后者如果长度有所不同。
nchar是固定长度的,可以容纳unicode字符。每个字符使用两个字节的存储空间。
varchar具有可变长度,不能包含unicode字符。每个字符使用一个字节的存储空间。
UCS-2
(恰好是SQL Server使用的编码)将每个字符精确地存储在两个字节中,请参阅msdn.microsoft.com/zh-cn/library/bb330962%28v=sql.90%29.aspx:SQL Server stores Unicode in the UCS-2 encoding scheme... UCS-2 is a fixed-length encoding that represents all characters as a 16-bit value (2 bytes)
。SQL Server 2008可以使用SCSU压缩,但是仍然压缩UCS-2编码的Unicode字符串:msdn.microsoft.com/zh-cn/library/ee240835.aspx
NVARCHAR可以存储Unicode字符,每个字符占用2个字节。
nvarchar
每个字符始终占用2个字节。