SQL Server中的char,nchar,varchar和nvarchar有什么区别?


Answers:


856

只是为了清理...或总结...

  • ncharnvarchar可以存储Unicode字符。
  • char并且无法存储Unicode字符。varchar
  • char并且nchar固定长度的,即使您没有用完所有空间,它也会为您指定的字符数保留存储空间。
  • varchar并且nvarchar可变长度的,只会占用存储字符的空间。它不会保留char或的存储空间nchar

nchar并且nvarchar会占用两倍的存储空间,因此仅当需要Unicode支持时才使用它们可能是明智的。


15
char和varchar并不是要存储unicode的,但是通过一些其他编码技巧和额外的逻辑,您仍然可以将[var] char字段误用于unicode存储。
Wim 10 Brink

10
这是否取决于n...版本是否占用我的答案所示的
Martin Smith,

7
保留存储的好处是什么?
mlissner

4
最后一点:使用Unicode,在大多数情况下,nchar和nvarchar仍然更好,排序规则更好,用户更灵活,消除了将来的兼容性问题。顺便说一句,对于这种情况,存储空间不是问题,因为使用不使用Unicode的排序规则会带来很多麻烦,并且将来内存的使用率将继续下降
Jaison Varghese

6
@BenCaine char(20)将使用20个字节(假设使用8位排序规则);varchar(20)将使用len(data)+2个字节,即22个字节表示20个字节的数据,而12个字节表示10个字节的数据。多余的两个字节是长度记录。如果您的数据将始终为全长,请使用char,因为它可以节省空间并且可能更快。请不要使用varchar(1)或任何小于varchar(4)的东西。varchar格式的单个字符使用三个字节,因此char(3)永远不会使用比varchar(3)更多的空间。
理查德·加兹登2014年

95

到目前为止,所有答案都表明varchar是单字节,nvarchar 是双字节。这的第一部分实际上取决于整理,如下所示。

DECLARE @T TABLE
(
C1 VARCHAR(20) COLLATE Chinese_Traditional_Stroke_Order_100_CS_AS_KS_WS,
C2 NVARCHAR(20)COLLATE  Chinese_Traditional_Stroke_Order_100_CS_AS_KS_WS
)

INSERT INTO @T 
    VALUES (N'中华人民共和国',N'中华人民共和国'),
           (N'abc',N'abc');

SELECT C1,
       C2,
       LEN(C1)        AS [LEN(C1)],
       DATALENGTH(C1) AS [DATALENGTH(C1)],
       LEN(C2)        AS [LEN(C2)],
       DATALENGTH(C2) AS [DATALENGTH(C2)]
FROM   @T  

退货

在此处输入图片说明

请注意,版本中仍不显示字符,VARCHAR而以静默替换?

实际上,在该排序规则中,单个字节不能代表任何汉字。唯一的单字节字符是典型的西方ASCII集。

因此,从nvarchar(X)列到varchar(X)列的插入可能会因截断错误而失败(其中X表示两个实例中的数字相同)。

SQL Server 2012添加了支持的SC(补充字符)排序规则UTF-16。在这些归类中,单个nvarchar字符可能占用2或4个字节。


4
我一直在寻找的答案。另外,为了节省与我一样的时间-非英语文字会翻译为“中华人民共和国” translate.google.com/#auto/en/…–
Igand

34

nchar和char的操作几乎完全相同,nvarchar和varchar也是如此。它们之间的唯一区别是nchar / nvarchar存储Unicode字符(如果需要使用扩展字符集,则必须存储),而varchar则不存储。

因为Unicode字符需要更多的存储空间,所以nchar / nvarchar字段占用的空间是原来的两倍(例如,在早期版本的SQL Server中,nvarchar字段的最大大小为4000)。

这个问题是一个重复的这一个


3
您会忘记一件事:nchar使用固定长度,因此nchar(10)始终需要接收十个字符。varchar(10)实际上是Unicode,可以接受任意数量的字符,最多10个字符。另请参见msdn.microsoft.com/en-us/library/ms186939.aspx
Wim十Brink

33

只是添加更多内容: nchar-在数据后添加空格。 nvarchar-不向数据添加尾随空格。

因此,如果要通过“ nchar”字段过滤数据集,则可能要使用RTRIM删除空格。例如,名为BRAND的nchar(10)字段存储单词NIKE。它在单词的右边添加了6个空格。因此,过滤时,表达式应显示为: RTRIM(Fields!BRAND.Value)=“ NIKE”

希望这对外面的人有所帮助,因为我刚刚为此苦了一下!


24

我试图总结和纠正现有答案:

首先,charnchar将始终使用的存储空间固定量,即使当要被存储的字符串的长度超出可用的空间更小,而varcharnvarchar如需要存储的字符串(加上开销的两个字节将只使用尽可能多的存储空间,大概存储字符串的长度)。因此请记住,在可变空间中,“ var”的意思是“变量”。

第二个主要的角度来理解的是,ncharnvarchar使用存储字符串恰好每个字符用两个字节,而charvarchar使用由核对代码页确定的编码,这将通常是每个字符正好一个字节(尽管有例外,见下文)。通过每个字符使用两个字节,一个非常广泛的字符可以存储,所以要记住的基本的事情是,ncharnvarchar往往是一个更好的选择,当你想要国际化的支持,你可能做的。

现在有一些更好的观点。

首先,ncharnvarchar始终使用UCS-2存储数据。这意味着每个字符将仅使用两个字节,并且“ nchar或” nvarchar字段可以存储基本多语言平面(BMP)中的任何Unicode字符。但是,并非可以存储任何 Unicode字符。例如,根据Wikipedia所述,埃及象形文字的代码点不在BMP之外。因此,存在可以用UTF-8表示的Unicode字符串以及不能存储在SQL Server ncharnvarchar字段中的其他真正的Unicode编码,并且其中包括用埃及象形文字编写的字符串。幸运的是,您的用户可能没有用该脚本编写代码,但是请记住这一点!

另一种混乱,但有趣的一点,其他海报强调的是,charvarchar字段可能每个字符使用两个字节的某些字符当核对代码页需要它。(马丁史密斯给出了一个很好的例子,他展示了Chinese_Traditional_Stroke_Order_100_CS_AS_KS_WS表现出这种行为。

更新:从SQL Server 2012开始,终于有了UTF-16的代码页,例如Latin1_General_100_CI_AS_SC,它可以真正覆盖整个Unicode范围。


14
  • char:固定长度的字符数据,最大长度为8000个字符。
  • nchar:固定长度的unicode数据,最大长度为4000个字符。
  • Char = 8位长度
  • NChar = 16位长度

char长度不能为8位。它不必存储长度,并且固定长度最多可以包含8000个字符。
John B. Lambe

12

nchar[(n)] (民族字符)

  • 固定长度的Unicode字符串数据。
  • n 定义字符串长度,并且必须是1到4,000之间的值。
  • 存储大小是n字节的两倍。

nvarchar [(n | max)] (民族字符各不相同。)

  • 可变长度的Unicode字符串数据。
  • n 定义字符串长度,可以是1到4,000之间的值。
  • max 表示最大存储大小为2 ^ 31-1字节(2 GB)。
  • 存储大小(以字节为单位)是输入的数据实际长度的两倍+ 2个字节

char [(n)] (字符)

  • 定长non-Unicode字符串数据。
  • n 定义字符串长度,并且必须是1到8,000之间的值。
  • 存储大小为n字节。

varchar [(n | max)] (字符不同)

  • 可变长度的非Unicode字符串数据。
  • n 定义字符串长度,可以是1到8,000之间的值。
  • max 表示最大存储大小为2 ^ 31-1字节(2 GB)。
  • 存储大小是输入数据的实际长度+ 2个字节。

7

不同之处在于:

  1. n [var] char存储unicode,而[var] char仅存储单字节字符。
  2. [n] char需要固定数量的长度正确的字符,而[n] varchar接受可变数量的字符,长度不超过所定义的长度。

另一个区别是长度。nchar和nvarchar最多可以包含4,000个字符。char和varchar的长度最多可以为8000个字符。但是对于SQL Server,您还可以使用[n] varchar(max),它最多可以处理2,147,483,648个字符。(两个千兆字节,一个带符号的4字节整数。)


7

nchar nvarchar 需要更多空间

例如,

即使您仅输入5,nchar(100)仍将始终存储100个字符,其余的95个字符将用空格填充。在nvarchar(100)中存储5个字符将保存5个字符。


6
并非完全正确,因为您需要用最多100个字符填充char(100)。例如,当您将电话号码存储在数据库中或具有固定长度的订单号时,将使用此功能。由于字段长度是固定的,因此您无法选择将其填充为最大字符数。但是,当所有数据都是每条记录100个字符时,char(100)会比varchar(100)占用更少的存储空间,因为它不需要长度指示:每个值都恰好是100个字符。
Wim 10 Brink

5

nchar(10)是长度为10的固定长度Unicode字符串。nvarchar(10)是最大长度为10的可变长度Unicode字符串。通常,如果所有数据值均为10个字符,则使用前者,而后者如果长度有所不同。


比较错误-问题与nchar和varchar有关,而不与nchar和nvarchar有关。
路加·本尼特

4
  • nchar是固定长度的,可以容纳unicode字符。每个字符使用两个字节的存储空间。

  • varchar具有可变长度,不能包含unicode字符。每个字符使用一个字节的存储空间。


错误。Unicode可以为每个字符使用1到4个字节(通常)。此外,varchar可以保存unicode,但无法识别为unicode。结果,varchar被认为对于unicode存储是不可靠的。(特别是因为存在访问该字段的代码可能会错误地转换它的风险。)
Wim 10 Brink

@亚历克斯:我想你是说清楚了,但我仍然不同意你的看法。您要说的是,如果long小于2 ^ 32,则int可以保留一个long。这不仅是“不可靠的”,而且是一个固有的局限性,无法覆盖整个价值范围。
Manu

4
@Workshop Alex:错。编码为的Unicode UCS-2(恰好是SQL Server使用的编码)将每个字符精确地存储在两个字节中,请参阅msdn.microsoft.com/zh-cn/library/bb330962%28v=sql.90%29.aspxSQL Server stores Unicode in the UCS-2 encoding scheme... UCS-2 is a fixed-length encoding that represents all characters as a 16-bit value (2 bytes)。SQL Server 2008可以使用SCSU压缩,但是仍然压缩UCS-2编码的Unicode字符串:msdn.microsoft.com/zh-cn/library/ee240835.aspx
Remus Rusanu 2010年

2

NVARCHAR可以存储Unicode字符,每个字符占用2个字节。


1
错误!Unicode每个字符使用1到4个字节!许多人忘记了这一点!甚至使用UTF-16也会导致某些字符占用4个字节而不是2个字节,尽管公共长度为2个字节。Unicode的某些其他子格式可能甚至需要超过4个字节!
Wim 10 Brink

7
@WimtenBrink-问题是有关SQL Server的,nvarchar每个字符始终占用2个字节。
马丁·史密斯

@Wim,您是正确的,有几种Unicode编码可以产生不同数量的字节。但是,SQL Server无法为您提供有关Unicode编码的选择。2012年之前的SQL Server仅使用UCS-2(两个字节宽),因此Martin在撰写答案时是正确的。正如上面其他答案所说的那样,SQL Server 2012现在提供UTF-16,因此对于许多字符(Unicode基本多语言平面中的字符)为两个字节,对于其他字符为四个字节。
混凝土塘鹅
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.