.toArray（new MyClass [0]）或.toArray（new MyClass [myList.size（）]）？

176

假设我有一个ArrayList

ArrayList<MyClass> myList;

我想调用toArray，是否有使用性能的理由

MyClass[] arr = myList.toArray(new MyClass[myList.size()]);

过度

MyClass[] arr = myList.toArray(new MyClass[0]);

？

我更喜欢第二种样式，因为它不太冗长，并且我假设编译器将确保不会真正创建空数组，但是我一直在想那是否是真的。

当然，在99％的情况下，它不会以一种或另一种方式改变，但是我想在我的普通代码和优化的内部循环之间保持一致的样式...

java performance coding-style

— Itadok
source

6

看来问题已经在AlekseyShipilёv的新博文《古代智慧的阵列》中解决了！

— 2016年

6

在博客文章中：“底线：toArray（new T [0]）看起来更快，更安全且从合约上讲更干净，因此现在应该是默认选择。”

— DavidS

108

违反直觉的是，在Hotspot 8上最快的版本是：

MyClass[] arr = myList.toArray(new MyClass[0]);

我已经使用jmh运行了一个微型基准测试，结果和代码如下所示，显示具有空数组的版本始终优于具有预定大小的数组的版本。请注意，如果您可以重复使用正确大小的现有数组，则结果可能会有所不同。

基准测试结果（分数以微秒为单位，较小=较好）：

Benchmark                      (n)  Mode  Samples    Score   Error  Units
c.a.p.SO29378922.preSize         1  avgt       30    0.025 ▒ 0.001  us/op
c.a.p.SO29378922.preSize       100  avgt       30    0.155 ▒ 0.004  us/op
c.a.p.SO29378922.preSize      1000  avgt       30    1.512 ▒ 0.031  us/op
c.a.p.SO29378922.preSize      5000  avgt       30    6.884 ▒ 0.130  us/op
c.a.p.SO29378922.preSize     10000  avgt       30   13.147 ▒ 0.199  us/op
c.a.p.SO29378922.preSize    100000  avgt       30  159.977 ▒ 5.292  us/op
c.a.p.SO29378922.resize          1  avgt       30    0.019 ▒ 0.000  us/op
c.a.p.SO29378922.resize        100  avgt       30    0.133 ▒ 0.003  us/op
c.a.p.SO29378922.resize       1000  avgt       30    1.075 ▒ 0.022  us/op
c.a.p.SO29378922.resize       5000  avgt       30    5.318 ▒ 0.121  us/op
c.a.p.SO29378922.resize      10000  avgt       30   10.652 ▒ 0.227  us/op
c.a.p.SO29378922.resize     100000  avgt       30  139.692 ▒ 8.957  us/op

供参考，代码：

@State(Scope.Thread)
@BenchmarkMode(Mode.AverageTime)
public class SO29378922 {
  @Param({"1", "100", "1000", "5000", "10000", "100000"}) int n;
  private final List<Integer> list = new ArrayList<>();
  @Setup public void populateList() {
    for (int i = 0; i < n; i++) list.add(0);
  }
  @Benchmark public Integer[] preSize() {
    return list.toArray(new Integer[n]);
  }
  @Benchmark public Integer[] resize() {
    return list.toArray(new Integer[0]);
  }
}

您可以在博客文章古代智慧阵列中找到类似的结果，完整的分析和讨论。总结一下：JVM和JIT编译器包含一些优化，使其可以廉价地创建和初始化一个新的正确大小的数组，而如果您自己创建该数组，则不能使用这些优化。

— 亚述
source

2

非常有趣的评论。我很惊讶没有人对此发表评论。我想这是因为就速度而言，它与这里的其他答案相矛盾。同样有趣的是，这家伙的声誉几乎高于所有其他答案（人们）的总和。

— Pimp Trizkit 2015年

我离题了。我还希望看到MyClass[] arr = myList.stream().toArray(MyClass[]::new);..的基准，我认为它会比较慢。另外，我想看看基准与数组声明的区别。如：MyClass[] arr = new MyClass[myList.size()]; arr = myList.toArray(arr);和MyClass[] arr = myList.toArray(new MyClass[myList.size()]);... 之间的区别，还是应该没有任何区别？我猜这两个是toArray功能发生之外的问题。但是，嘿！我认为我不会了解其他复杂的差异。

— Pimp Trizkit 2015年

1

@PimpTrizkit刚刚检查：使用额外的变量不会产生预期的差异，使用流toArray直接调用需要花费60％到100％的时间（大小越小，相对开销越大）

— assylias

哇，反应很快！谢谢！是的，我怀疑。转换为流听起来并不高效。但是你永远不知道！

— Pimp Trizkit 2015年

2

在这里找到了相同的结论：shipilev.net/blog/2016/arrays-wisdom-ancients

— user167019 2016年

122

从Java 5中的ArrayList开始，如果数组具有正确的大小（或更大），则将已填充该数组。所以

MyClass[] arr = myList.toArray(new MyClass[myList.size()]);

将创建一个数组对象，填充它并将其返回到“ arr”。另一方面

MyClass[] arr = myList.toArray(new MyClass[0]);

将创建两个数组。第二个是长度为0的MyClass数组。因此，将为对象创建一个对象，该对象将立即被丢弃。就源代码而言，编译器/ JIT无法优化此代码，因此无法创建它。此外，使用零长度对象会导致toArray（）方法中的转换。

请参见ArrayList.toArray（）的来源：

public <T> T[] toArray(T[] a) {
    if (a.length < size)
        // Make a new array of a's runtime type, but my contents:
        return (T[]) Arrays.copyOf(elementData, size, a.getClass());
    System.arraycopy(elementData, 0, a, 0, size);
    if (a.length > size)
        a[size] = null;
    return a;
}

使用第一种方法，以便仅创建一个对象，并避免（隐式但仍然很昂贵）强制转换。

— 乔治
source

1

有两个评论可能对某人感兴趣：1） LinkedList.toArray（T [] a）甚至更慢（使用反射：Array.newInstance）并且更复杂；2）另一方面，在JDK7版本中，我很惊讶地发现，通常很慢的Array.newInstance的执行速度几乎与通常的数组创建一样快！

— 2011年

1

@ktaria size是ArrayList的私有成员，指定**** suprise ****的大小。参见ArrayList源代码

— MyPasswordIsLasercats 2014年

3

在没有基准的情况下猜测性能仅在平凡的情况下有效。实际上，new Myclass[0]速度更快：shipilev.net/blog/2016/arrays-wisdom-ancients

— Karol S

这已不再是有效的答案，因为JDK6 +的

— АнтонАнтонов

28

通过JetBrains Intellij Idea检查：

有两种样式可以将集合转换为数组：使用预大小数组（如c.toArray（new String [c.size（）]））或使用空数组（如c.toArray（new String [ 0]）。
在较早的Java版本中，建议使用预先设置大小的数组，因为创建适当大小的数组所需的反射调用非常慢。但是，由于OpenJDK 6的更新较晚，因此此调用很吸引人，与空大小版本相比，空数组版本的性能相同，有时甚至更好。同样，传递预大小的数组对于并发或同步收集也是危险的，因为如果size和toArray 调用在操作过程中同时收缩，则在size和toArray调用之间可能会发生数据争用，这可能会在数组末尾产生额外的null。

此检查允许遵循统一的样式：使用空数组（在现代Java中建议使用）或使用预定大小的数组（在较早的Java版本或基于非HotSpot的JVM中可能更快）。

— АнтонАнтонов
source

如果所有这些都被复制/引用了文本，我们是否可以相应地设置其格式并提供到源的链接？我实际上是因为IntelliJ检查而来到这里的，我对查找他们所有检查及其背后原因的链接非常感兴趣。

— 蒂姆·布斯（TimBüthe）

3

：在这里，你可以检查检查文本github.com/JetBrains/intellij-community/tree/master/plugins/...

— АнтонАнтонов

github.com/JetBrains/intellij-community/blob/master/plugins/…–

— Petrakeas

17

在这种情况下，现代JVM优化了反射阵列的构造，因此性能差异很小。在样板代码中两次命名集合不是一个好主意，因此我避免使用第一种方法。第二个优点是它可以与同步和并发集合一起使用。如果要进行优化，请重用空数组（空数组是不可变的，可以共享），或使用profiler（！）。

— 汤姆·霍顿-大头钉
source

2

赞成“重用空数组”，因为这是值得考虑的可读性和潜在性能之间的折衷。传递参数声明private static final MyClass[] EMPTY_MY_CLASS_ARRAY = new MyClass[0]不阻止返回的数组从由反射被构造，但它确实防止每个每次被构造一个附加阵列。

— Michael Scheper

Machael是正确的，如果使用零长度数组，则无法解决：（T []）java.lang.reflect.Array.newInstance（a.getClass（）。getComponentType（），size）; 如果大小> = ActualSize（JDK7），这将是多余的

— 亚历克斯

如果您可以引用“现代JVM在这种情况下优化反射阵列的构造”，那么我会很乐意赞成这个答案。

— Tom Panning

我在这里学习如果相反，我使用：MyClass[] arr = myList.stream().toArray(MyClass[]::new);对同步和并发的集合有帮助还是不利？又为什么呢请。

— Pimp Trizkit 2015年

3

toArray检查所传递的数组的大小是否正确（即足够大以适合列表中的元素），如果是，则使用该数组。因此，如果提供的数组大小小于要求的大小，则会反身创建一个新的数组。

在您的情况下，大小为零的数组是不可变的，因此可以安全地将其提升为静态最终变量，这可以使您的代码更简洁一些，从而避免了在每次调用时创建该数组。无论如何，都会在方法内部创建一个新数组，因此这是可读性的优化。

可以说，更快的版本是传递正确大小的数组，但除非可以证明此代码是性能瓶颈，否则除非可读性强，否则应优先考虑可读性而不是运行时性能。

— 戴夫·切尼
source

2

第一种情况更有效。

那是因为在第二种情况下：

MyClass[] arr = myList.toArray(new MyClass[0]);

运行时实际上会创建一个空数组（大小为零），然后在toArray方法内部创建另一个数组以适合实际数据。使用以下代码（取自jdk1.5.0_10）使用反射完成创建：

public <T> T[] toArray(T[] a) {
    if (a.length < size)
        a = (T[])java.lang.reflect.Array.
    newInstance(a.getClass().getComponentType(), size);
System.arraycopy(elementData, 0, a, 0, size);
    if (a.length > size)
        a[size] = null;
    return a;
}

通过使用第一种形式，您可以避免创建第二个数组，也可以避免使用反射代码。

— 帕纳吉奥蒂斯·科罗斯
source

toArray（）不使用反射。无论如何，至少只要您不算“投射”到反射即可；-)。

— Georgi

toArray（T []）可以。它需要创建适当类型的数组。现代JVM将这种反射优化为与非反射版本大致相同的速度。

— Tom Hawtin-大头钉

我认为它确实使用了反射。JDK 1.5.0_10可以肯定地做到这一点，而反射是我知道创建在编译时不知道的类型的数组的唯一方法。

— Panagiotis Korros

然后，她的一个源代码示例（上面的一个或我的一个）已过时。可悲的是，我没有找到适合我的子版本号。

— Georgi

1

Georgi，您的代码来自JDK 1.6，如果您看到Arrays.copyTo方法的实现，您将看到该实现使用反射。

— Panagiotis Korros

-1

第二个是微乎其微的可读性，但是几乎没有什么改进是不值得的。第一种方法更快，在运行时没有缺点，所以这就是我使用的方法。但是我用第二种方式编写它，因为键入速度更快。然后，我的IDE会将其标记为警告，并提出对其进行修复。只需一次按键，它将代码从第二种类型转换为第一种类型。

— 米格尔·穆诺兹（MiguelMunoz）
source

-2

将'toArray'与正确大小的数组一起使用会更好，因为替代方法将首先创建零大小的数组，然后创建正确大小的数组。但是，正如您所说，差异可能微不足道。

另外，请注意，javac编译器不会执行任何优化。如今，所有优化都由JIT / HotSpot编译器在运行时执行。我不知道任何JVM中围绕“ toArray”进行的任何优化。

因此，问题的答案很大程度上取决于样式，但出于一致性的考虑，应成为您遵守的任何编码标准的一部分（无论是有文件证明的还是其他形式的证明）。

— 马修·默多克（Matthew Murdoch）
source

OTOH，如果标准是使用零长度数组，则出现偏差的情况表明性能是一个问题。

— Michael Scheper

-5

整数的示例代码：

Integer[] arr = myList.toArray(new integer[0]);

— 雷索尔
source