字符串与StringBuilder


215

我明白之间的差别StringStringBuilderStringBuilder是可变的),但两者之间有较大的性能差异?

我正在处理的程序有很多大小写驱动的字符串追加(500+)。使用StringBuilder更好的选择吗?

Answers:


236

是的,性能差异很大。请参见知识库文章“ 如何在Visual C#中提高字符串连接性能 ”。

我一直试图先为清晰起见编写代码,然后再为性能进行优化。这比其他方法要容易得多!但是,在看到两者之间我的应用程序之间存在巨大的性能差异之后,我现在要更加仔细地考虑它。

幸运的是,在代码上运行性能分析以查看花费的时间,然后将其修改为StringBuilder需要的地方相对简单。


44
一个好的经验法则是,在不打算更改字符串时使用Strings,而在要更改字符串时使用StringBuilder。
蒂姆(Tim)

31
我非常喜欢这个答案,尤其是在性能提高之前进行编码的建议。作为开发人员,我们花费的时间与编写代码的时间相同或更多。
Scott Lawrence

Outlaw:如果我正确理解StackOverflow,我认为这应该成为单独投票的答案。
杰·巴祖兹

2
根据我的经验,如果您尝试连接10-15左右的弦,则可以使用弦,但是如果没有。字符串的数量超过了该数量,则使用字符串生成器
Peeyush 2012年

3
它仍然取决于人们如何使用它,作为对实际测试的参考,我喜欢编码恐怖-微型优化剧院的悲惨悲剧
Erik Philips

56

为了澄清吉莉安所说的关于4弦的话,如果您有这样的话:

string a,b,c,d;
 a = b + c + d;

那么使用字符串和加号运算符会更快。这是因为(就像Eric所指出的Java一样),它在内部自动使用StringBuilder(实际上,它使用StringBuilder也使用的原语)

但是,如果您正在做的事情更接近:

string a,b,c,d;
 a = a + b;
 a = a + c;
 a = a + d;

然后,您需要显式使用StringBuilder。.Net不会在这里自动创建StringBuilder,因为它毫无意义。在每一行的末尾,“ a”必须是一个(不可变的)字符串,因此它必须在每一行上创建并放置一个StringBuilder。为了提高速度,您需要使用相同的StringBuilder直到完成构建:

string a,b,c,d;
StringBuilder e = new StringBuilder();
 e.Append(b);
 e.Append(c);
 e.Append(d);
 a = e.ToString();

5
C#编译器没有理由需要将第二个样本与第一个样本区别对待。特别是,没有义务在每一行的末尾产生字符串。编译器的行为可能与您所说的一样,但没有义务这样做。
CodesInChaos

@CodesInChaos,在每行的末尾专门分配了一个不变的字符串变量,这不是产生字符串的义务吗?但是,我同意这样的观点,即没有理由以不同的方式对待每条单独的生产线(并且我不确定是否这样做),但是性能损失来自重新分配,所以没有关系。
Saeb Amini 2015年

@SaebAmini-如果a是局部变量,并且它所引用的对象尚未分配给其他变量(其他线程可能可以访问),那么良好的优化程序可以确定在此序列期间其他任何代码a都无法访问该变量线 只有事情的最终价值。因此,它可以将这三行代码视为已编写。aa = b + c + d;
制造商史蒂夫(Steve)

29

如果您要执行多个循环或在代码传递中进行派生,则StringBuilder是更可取的...但是,为了实现纯性能,如果您可以摆脱单个字符串声明,那么性能会更高。

例如:

string myString = "Some stuff" + var1 + " more stuff"
                  + var2 + " other stuff" .... etc... etc...;

StringBuilder sb = new StringBuilder();
sb.Append("Some Stuff");
sb.Append(var1);
sb.Append(" more stuff");
sb.Append(var2);
sb.Append("other stuff");
// etc.. etc.. etc..

在这种情况下,StringBuild可能被认为更具可维护性,但性能不比单个字符串声明高。

十分之九(...)使用字符串生成器。

附带说明一下:string + var也比在内部使用StringBuilder的string.Format方法(通常)具有更高的性能(如果有疑问,请检查反射器!)


17
希望您能说出您如何知道/如何验证。
ChrisW

2
您无需在反射器中验证性能:您可以通过定时发布代码验证性能,使用探查器进行分析,并使用反射器寻求解释。
Albin Sunnanbo 2010年

3
考虑使用String.Format()连接少量的小字符串,尤其是目标是格式化消息以向用户显示。
加里·金德尔

1
这是非常糟糕的信息。(“字符串myString性能更高”)根本不正确。
汤姆·斯蒂克

3
该答案中的信息不正确。StringBuilder比同一条语句中的连接要快一些;但是,如果您进行数十万次,您只会注意到两者之间的差异(Source)。正如消息来源所说,“没关系!”
David Sherret 2014年

25

一个简单的示例演示使用String串联vs 时速度的差异StringBuilder

System.Diagnostics.Stopwatch time = new Stopwatch();
string test = string.Empty;
time.Start();
for (int i = 0; i < 100000; i++)
{
    test += i;
}
time.Stop();
System.Console.WriteLine("Using String concatenation: " + time.ElapsedMilliseconds + " milliseconds");

结果:

使用字符串连接:15423毫秒

StringBuilder test1 = new StringBuilder();
time.Reset();
time.Start();
for (int i = 0; i < 100000; i++)
{
    test1.Append(i);
}
time.Stop();
System.Console.WriteLine("Using StringBuilder: " + time.ElapsedMilliseconds + " milliseconds");

结果:

使用StringBuilder:10毫秒

结果,第一次迭代花费了15423毫秒,而第二次迭代StringBuilder花费了10毫秒。

在我看来,使用起来StringBuilder更快,更快。


24

此基准表明,合并3个或更少的字符串时,常规串联速度更快。

http://www.chinhdo.com/20070224/stringbuilder-is-not-always-faster/

StringBuilder可以显着提高内存使用率,尤其是在将500个字符串加在一起的情况下。

考虑以下示例:

string buffer = "The numbers are: ";
for( int i = 0; i < 5; i++)
{
    buffer += i.ToString();
}
return buffer;

内存中会发生什么?将创建以下字符串:

1 - "The numbers are: "
2 - "0"
3 - "The numbers are: 0"
4 - "1"
5 - "The numbers are: 01"
6 - "2"
7 - "The numbers are: 012"
8 - "3"
9 - "The numbers are: 0123"
10 - "4"
11 - "The numbers are: 01234"
12 - "5"
13 - "The numbers are: 012345"

通过将这五个数字添加到字符串的末尾,我们创建了13个字符串对象!其中有12个毫无用处!哇!

StringBuilder解决了此问题。它不是我们经常听到的“可变字符串”(.NET中的所有字符串都是不可变的)。它通过保留一个内部缓冲区(一个char数组)来工作。调用Append()或AppendLine()会将字符串添加到char数组末尾的空白处。如果数组太小,它将创建一个更大的新数组,并在其中复制缓冲区。因此,在上面的示例中,StringBuilder可能只需要单个数组即可包含字符串的所有5个附加值-取决于其缓冲区的大小。您可以告诉StringBuilder它的缓冲区在构造函数中应该有多大。


2
次要要点:说“我们创建了13个字符串对象,其中12个是无用的”,然后说StringBuilder解决了此问题,这有点奇怪。毕竟,您别无选择,只能创建六个字符串。他们来自i.ToString()。因此,使用StringBuilder,您仍然必须创建6 + 1字符串;它将创建13个字符串减少为创建7个字符串。但这仍然是错误的观察方式。六个数字字符串的创建无关紧要。底线:您根本不应该提到i.ToString(); 创建的六个字符串。它们不是效率比较的一部分。
制造商史蒂夫

12

是的,StringBuilder在对字符串执行重复操作时可以提供更好的性能。这是因为所有更改都是针对单个实例进行的,因此可以节省大量时间,而不必创建类似的新实例String

字符串与Stringbuilder

  • String

    1. System命名空间下
    2. 不变(只读)实例
    3. 不断发生价值变化时,性能会下降
    4. 线程安全
  • StringBuilder (可变字符串)

    1. System.Text命名空间下
    2. 可变实例
    3. 由于对现有实例进行了新更改,因此显示了更好的性能

强烈推荐dotnet mob文章:C#中的String VS StringBuilder

相关的堆栈溢出问题:当字符串在C#中不变时,字符串的可变性?


12

字符串与字符串生成器:

首先,您必须知道这两个类在哪个组件中生活?

所以,

字符串存在于System名称空间中。

StringBuilder存在于System.Text名称空间中。

对于字符串声明:

您必须包括System名称空间。这样的事情。 Using System;

对于StringBuilder声明:

您必须包括System.text名称空间。这样的事情。 Using System.text;

现在来实际的问题。

stringStringBuilder之间的区别是什么?

两者之间的主要区别在于:

字符串是不可变的。

StringBuilder是可变的。

因此,现在让我们讨论不可变可变之间的区别

可变::表示可变。

不可变::表示不可更改。

例如:

using System;

namespace StringVsStrigBuilder
{
    class Program
    {
        static void Main(string[] args)
        {
            // String Example

            string name = "Rehan";
            name = name + "Shah";
            name = name + "RS";
            name = name + "---";
            name = name + "I love to write programs.";

            // Now when I run this program this output will be look like this.
            // output : "Rehan Shah RS --- I love to write programs."
        }
    }
}

因此,在这种情况下,我们将更改同一对象5次。

因此,显而易见的问题是!当我们将相同的琴弦改变5次时,实际上发生了什么。

这是我们将相同的字符串更改5次后发生的情况。

让我们看看图。

在此处输入图片说明

说明:

当我们第一次将变量“ name”初始化为“ Rehan”时,即string name = "Rehan" 在堆栈“ name”上创建该变量并指向该“ Rehan”值。执行此行后:“ name = name +” Shah“。引用变量不再指向该对象” Rehan“,现在指向” Shah“,依此类推。

string是不可变的,这意味着一旦我们在内存中创建了对象,就无法更改它们。

因此,当我们隐含name变量时,先前的对象将保留在内存中,并创建另一个新的字符串对象...

因此,根据上图,我们有五个对象,四个对象被扔掉了,根本没有使用。它们仍然保留在内存中,并且占用内存量。“垃圾收集器”对此负责,因此请清除内存中的资源。

因此,在任何情况下,当我们一遍又一遍地操作字符串时,都会有许多对象创建并保留在内存中。

这就是字符串Variable的故事。

现在,让我们看一下StringBuilder对象。 例如:

using System;
using System.Text;

namespace StringVsStrigBuilder
{
    class Program
    {
        static void Main(string[] args)
        {
            // StringBuilder Example

            StringBuilder name = new StringBuilder();
            name.Append("Rehan");
            name.Append("Shah");
            name.Append("RS");
            name.Append("---");
            name.Append("I love to write programs.");


            // Now when I run this program this output will be look like this.
            // output : "Rehan Shah Rs --- I love to write programs."
        }
    }
}

因此,在这种情况下,我们将更改同一对象5次。

因此,显而易见的问题是!当我们将相同的StringBuilder更改5次时,实际上发生了什么。

这就是我们更改相同的StringBuilder 5次时发生的情况。

让我们看看图。 在此处输入图片说明

说明: 对于StringBuilder对象。您不会得到新对象。同一对象将在内存中发生更改,因此即使您将对象更改了10,000次,我们仍然只有一个stringBuilder对象。

您没有很多垃圾对象或未引用的stringBuilder对象,因为为什么可以更改它。它是可变的,意味着它会随时间变化吗?

差异:

  • 在System命名空间中存在String,而在System.Text命名空间中存在Stringbuilder。
  • 在StringBuilder是mutabe的地方,string是不可变的。

8

StringBuilder减少了分配和分配的数量,但使用了额外的内存。正确使用它可以完全避免编译器一遍又一遍地分配越来越大的字符串,直到找到结果为止。

string result = "";
for(int i = 0; i != N; ++i)
{
   result = result + i.ToString();   // allocates a new string, then assigns it to result, which gets repeated N times
}

String result;
StringBuilder sb = new StringBuilder(10000);   // create a buffer of 10k
for(int i = 0; i != N; ++i)
{
   sb.Append(i.ToString());          // fill the buffer, resizing if it overflows the buffer
}

result = sb.ToString();   // assigns once

5

String或StringBuilder对象的串联操作的性能取决于内存分配发生的频率。String串联操作始终分配内存,而StringBuilder串联操作仅在StringBuilder对象缓冲区太小而无法容纳新数据时分配内存。因此,如果串联固定数量的String对象,则String类对于串联操作是更可取的。在这种情况下,编译器甚至可以将单个串联操作组合为单个操作。如果串联任意数量的字符串,则StringBuilder对象对于串联操作是更可取的。例如,如果循环连接了随机数量的用户输入字符串。

资料来源:MSDN


3

StringBuilder 从许多非恒定值构建字符串更好。

如果要从许多常量值中构建字符串,例如HTML或XML文档中的多行值或其他文本块,则只需附加到同一字符串即可,因为几乎所有编译器都可以这样做“常量折叠”是一种减少解析树的过程,当您进行一堆常量操作时(在编写类似的东西时也会使用它int minutesPerYear = 24 * 365 * 60)。对于带有非恒定值的简单情况,.NET编译器会将您的代码缩减为类似于StringBuilder

但是,当编译器无法将您的附加内容简化为更简单的内容时,您需要使用StringBuilder。正如fizch指出的那样,这更有可能在循环内发生。


2

我相信,如果您需要将4个以上的字符串附加在一起,则StringBuilder会更快。另外,它还可以做一些很棒的事情,例如AppendLine。


2

在.NET中,StringBuilder仍然比附加字符串快。我很确定在Java中,当您添加字符串时,它们只是在幕后创建了一个StringBuffer,因此并没有什么区别。我不确定为什么他们还没有在.NET中做到这一点。



2

使用字符串进行串联会导致运行时复杂度大约为O(n^2)

如果使用StringBuilder,则需要执行的内存复制要少得多。StringBuilder(int capacity)如果您可以估算决赛的人数,则可以使用来提高性能String。即使您不够精确,也可能只需要将容量增加StringBuilder几次即可,这也有助于提高性能。


2

通过在任何字符串存储中使用EnsureCapacity(int capacity)方法实例StringBuilder之前使用方法调用,我已经看到了显着的性能提升。我通常在实例化之后在代码行中调用它。它具有与实例化StringBuilder类似的效果:

var sb = new StringBuilder(int capacity);

该调用会提前分配所需的内存,这会导致在多次Append()操作期间较少的内存分配。您必须对需要多少内存做出有根据的猜测,但是对于大多数应用程序来说,这应该不太困难。我通常会在内存过多方面犯错(我们正在谈论1k左右)。


实例化EnsureCapacity之后,无需调用StringBuilder。只需StringBuilder像这样实例化:var sb = new StringBuilder(int capacity)
David FerenczyRogožan16年

有人告诉我使用素数会有所帮助。
卡尔·吉特森

1

除了前面的答案,考虑这样的问题时,我总是做的第一件事就是创建一个小型测试应用程序。在此应用程序中,针对这两种情况执行一些时序测试,然后亲自查看哪个更快。

恕我直言,追加500多个字符串条目绝对应该使用StringBuilder。


1

实际上,String和StringBuilder都是不可变的,StringBuilder内置了缓冲区,可以更有效地管理其大小。当StringBuilder需要调整大小时,就是在堆上重新分配它的时间。默认情况下,它的大小为16个字符,您可以在构造函数中进行设置。

例如。

StringBuilder sb =新的StringBuilder(50);


2
不确定您了解什么是不变的。字符串是不可变的,不能更改。实际上,任何“更改”只是旧值保留在堆上,而没有任何指针可以找到它。StringBuilder(可变)是堆上的引用类型,指向堆的指针已更改,并且为此更改分配了空间。
Tom Stickel 2014年

1

字符串连接将花费更多。在Java中,您可以根据需要使用StringBuffer或StringBuilder。如果您想要同步且线程安全的实现,请使用StringBuffer。这将比String串联更快。

如果不需要同步或线程安全的实现,请使用StringBuilder。这将比String串联快,也比StringBuffer快,因为它们没有同步开销。


0

StringBuilder可能更可取。原因是它分配的空间超出了当前所需的空间(您设置了字符数),为将来的追加留出了空间。然后,那些适合当前缓冲区的将来的追加不需要任何内存分配或垃圾回收,这可能会很昂贵。通常,我使用StringBuilder进行复杂的字符串连接或多种格式,然后在数据完成后将其转换为普通的String,并且我再次想要一个不可变的对象。


0

如果您要进行大量的字符串连接,请使用StringBuilder。与字符串连接时,每次都会创建一个新的字符串,从而占用更多的内存。

亚历克斯


0

作为一般经验法则,如果我必须多次设置字符串的值,或者该字符串有任何追加,则它必须是一个字符串生成器。在了解字符串构建器之前,我曾经看过我写过的应用程序,这些构建器具有巨大的内存足迹,而且似乎还在不断增长。更改这些程序以使用字符串生成器可以显着减少内存使用。现在,我向字符串生成器宣誓。



0

StringBuilder 可以大大提高效率,但是除非进行大量的字符串修改,否则您将看不到这种性能。

下面是一个简短的代码块,以提供有关性能的示例。如您所见,当您进行大型迭代时,您实际上才真正开始看到性能的大幅提高。

如您所见,200,000次迭代耗时22秒,而使用进行的100万次迭代StringBuilder几乎是即时的。

string s = string.Empty;
StringBuilder sb = new StringBuilder();

Console.WriteLine("Beginning String + at " + DateTime.Now.ToString());

for (int i = 0; i <= 50000; i++)
{
    s = s + 'A';
}

Console.WriteLine("Finished String + at " + DateTime.Now.ToString());
Console.WriteLine();

Console.WriteLine("Beginning String + at " + DateTime.Now.ToString());

for (int i = 0; i <= 200000; i++)
{
    s = s + 'A';
}

Console.WriteLine("Finished String + at " + DateTime.Now.ToString());
Console.WriteLine();
Console.WriteLine("Beginning Sb append at " + DateTime.Now.ToString());

for (int i = 0; i <= 1000000; i++)
{
    sb.Append("A");
}
Console.WriteLine("Finished Sb append at " + DateTime.Now.ToString());

Console.ReadLine();

上面代码的结果:

在2013年1月28日16:55:40开始使用String +。

在2013年1月28日16:55:40处完成字符串+。

在2013年1月28日16:55:40开始使用String +。

在2013年1月28日16:56:02完成字符串+。

从SB开始于2013年1月28日16:56:02附加。

在2013年1月28日16:56:02完成Sb附加。


1
如果字符串构建器是如此强大,那么为什么我们要有字符串存在。为什么我们不彻底清除String。我问了这个问题,以便您可以告诉我String在StringBuilder上的好处
牢不可破

-2

从内存的角度来看,StringBuilder的性能会更好。至于处理,执行时间的差异可以忽略不计。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.