.toArray(new MyClass [0])或.toArray(new MyClass [myList.size()])?


176

假设我有一个ArrayList

ArrayList<MyClass> myList;

我想调用toArray,是否有使用性能的理由

MyClass[] arr = myList.toArray(new MyClass[myList.size()]);

过度

MyClass[] arr = myList.toArray(new MyClass[0]);

我更喜欢第二种样式,因为它不太冗长,并且我假设编译器将确保不会真正创建空数组,但是我一直在想那是否是真的。

当然,在99%的情况下,它不会以一种或另一种方式改变,但是我想在我的普通代码和优化的内部循环之间保持一致的样式...


6
看来问题已经在AlekseyShipilёv的新博文《古代智慧的阵列》中解决了
2016年

6
在博客文章中:“底线:toArray(new T [0])看起来更快,更安全且从合约上讲更干净,因此现在应该是默认选择。”
DavidS

Answers:


108

违反直觉的是,在Hotspot 8上最快的版本是:

MyClass[] arr = myList.toArray(new MyClass[0]);

我已经使用jmh运行了一个微型基准测试,结果和代码如下所示,显示具有空数组的版本始终优于具有预定大小的数组的版本。请注意,如果您可以重复使用正确大小的现有数组,则结果可能会有所不同。

基准测试结果(分数以微秒为单位,较小=较好):

Benchmark                      (n)  Mode  Samples    Score   Error  Units
c.a.p.SO29378922.preSize         1  avgt       30    0.025  0.001  us/op
c.a.p.SO29378922.preSize       100  avgt       30    0.155  0.004  us/op
c.a.p.SO29378922.preSize      1000  avgt       30    1.512  0.031  us/op
c.a.p.SO29378922.preSize      5000  avgt       30    6.884  0.130  us/op
c.a.p.SO29378922.preSize     10000  avgt       30   13.147  0.199  us/op
c.a.p.SO29378922.preSize    100000  avgt       30  159.977  5.292  us/op
c.a.p.SO29378922.resize          1  avgt       30    0.019  0.000  us/op
c.a.p.SO29378922.resize        100  avgt       30    0.133  0.003  us/op
c.a.p.SO29378922.resize       1000  avgt       30    1.075  0.022  us/op
c.a.p.SO29378922.resize       5000  avgt       30    5.318  0.121  us/op
c.a.p.SO29378922.resize      10000  avgt       30   10.652  0.227  us/op
c.a.p.SO29378922.resize     100000  avgt       30  139.692  8.957  us/op

供参考,代码:

@State(Scope.Thread)
@BenchmarkMode(Mode.AverageTime)
public class SO29378922 {
  @Param({"1", "100", "1000", "5000", "10000", "100000"}) int n;
  private final List<Integer> list = new ArrayList<>();
  @Setup public void populateList() {
    for (int i = 0; i < n; i++) list.add(0);
  }
  @Benchmark public Integer[] preSize() {
    return list.toArray(new Integer[n]);
  }
  @Benchmark public Integer[] resize() {
    return list.toArray(new Integer[0]);
  }
}

您可以在博客文章古代智慧阵列中找到类似的结果,完整的分析和讨论。总结一下:JVM和JIT编译器包含一些优化,使其可以廉价地创建和初始化一个新的正确大小的数组,而如果您自己创建该数组,则不能使用这些优化。


2
非常有趣的评论。我很惊讶没有人对此发表评论。我想这是因为就速度而言,它与这里的其他答案相矛盾。同样有趣的是,这家伙的声​​誉几乎高于所有其他答案(人们)的总和。
Pimp Trizkit 2015年

我离题了。我还希望看到MyClass[] arr = myList.stream().toArray(MyClass[]::new);..的基准,我认为它会比较慢。另外,我想看看基准与数组声明的区别。如:MyClass[] arr = new MyClass[myList.size()]; arr = myList.toArray(arr);MyClass[] arr = myList.toArray(new MyClass[myList.size()]);... 之间的区别,还是应该没有任何区别?我猜这两个是toArray功能发生之外的问题。但是,嘿!我认为我不会了解其他复杂的差异。
Pimp Trizkit 2015年

1
@PimpTrizkit刚刚检查:使用额外的变量不会产生预期的差异,使用流toArray直接调用需要花费60%到100%的时间(大小越小,相对开销越大)
assylias

哇,反应很快!谢谢!是的,我怀疑。转换为流听起来并不高效。但是你永远不知道!
Pimp Trizkit 2015年

2
在这里找到了相同的结论:shipilev.net/blog/2016/arrays-wisdom-ancients
user167019 2016年

122

Java 5中ArrayList开始,如果数组具有正确的大小(或更大),则将已填充该数组。所以

MyClass[] arr = myList.toArray(new MyClass[myList.size()]);

将创建一个数组对象,填充它并将其返回到“ arr”。另一方面

MyClass[] arr = myList.toArray(new MyClass[0]);

将创建两个数组。第二个是长度为0的MyClass数组。因此,将为对象创建一个对象,该对象将立即被丢弃。就源代码而言,编译器/ JIT无法优化此代码,因此无法创建它。此外,使用零长度对象会导致toArray()方法中的转换。

请参见ArrayList.toArray()的来源:

public <T> T[] toArray(T[] a) {
    if (a.length < size)
        // Make a new array of a's runtime type, but my contents:
        return (T[]) Arrays.copyOf(elementData, size, a.getClass());
    System.arraycopy(elementData, 0, a, 0, size);
    if (a.length > size)
        a[size] = null;
    return a;
}

使用第一种方法,以便仅创建一个对象,并避免(隐式但仍然很昂贵)强制转换。


1
有两个评论可能对某人感兴趣:1) LinkedList.toArray(T [] a)甚至更慢(使用反射:Array.newInstance)并且更复杂;2)另一方面,在JDK7版本中,我很惊讶地发现,通常很慢的Array.newInstance的执行速度几乎与通常的数组创建一样快
2011年

1
@ktaria size是ArrayList的私有成员,指定**** suprise ****的大小。参见ArrayList源代码
MyPasswordIsLasercats 2014年

3
在没有基准的情况下猜测性能仅在平凡的情况下有效。实际上,new Myclass[0]速度更快:shipilev.net/blog/2016/arrays-wisdom-ancients
Karol S

这已不再是有效的答案,因为JDK6 +的
АнтонАнтонов

28

通过JetBrains Intellij Idea检查:

有两种样式可以将集合转换为数组:使用预大小数组(如c.toArray(new String [c.size()]))或使用空数组(如c.toArray(new String [ 0])

在较早的Java版本中,建议使用预先设置大小的数组,因为创建适当大小的数组所需的反射调用非常慢。但是,由于OpenJDK 6的更新较晚,因此此调用很吸引人,与空大小版本相比,空数组版本的性能相同,有时甚至更好。同样,传递预大小的数组对于并发或同步收集也是危险的,因为如果sizetoArray 调用在操作过程中同时收缩,则在sizetoArray调用之间可能会发生数据争用 ,这可能会在数组末尾产生额外的null。

此检查允许遵循统一的样式:使用空数组(在现代Java中建议使用)或使用预定大小的数组(在较早的Java版本或基于非HotSpot的JVM中可能更快)。


如果所有这些都被复制/引用了文本,我们是否可以相应地设置其格式并提供到源的链接?我实际上是因为IntelliJ检查而来到这里的,我对查找他们所有检查及其背后原因的链接非常感兴趣。
蒂姆·布斯(TimBüthe)



17

在这种情况下,现代JVM优化了反射阵列的构造,因此性能差异很小。在样板代码中两次命名集合不是一个好主意,因此我避免使用第一种方法。第二个优点是它可以与同步和并发集合一起使用。如果要进行优化,请重用空数组(空数组是不可变的,可以共享),或使用profiler(!)。


2
赞成“重用空数组”,因为这是值得考虑的可读性和潜在性能之间的折衷。传递参数声明private static final MyClass[] EMPTY_MY_CLASS_ARRAY = new MyClass[0]不阻止返回的数组从由反射被构造,但它确实防止每个每次被构造一个附加阵列。
Michael Scheper

Machael是正确的,如果使用零长度数组,则无法解决:(T [])java.lang.reflect.Array.newInstance(a.getClass()。getComponentType(),size); 如果大小> = ActualSize(JDK7),这将是多余的
亚历克斯

如果您可以引用“现代JVM在这种情况下优化反射阵列的构造”,那么我会很乐意赞成这个答案。
Tom Panning

我在这里学习 如果相反,我使用:MyClass[] arr = myList.stream().toArray(MyClass[]::new);对同步和并发的集合有帮助还是不利?又为什么呢 请。
Pimp Trizkit 2015年

3

toArray检查所传递的数组的大小是否正确(即足够大以适合列表中的元素),如果是,则使用该数组。因此,如果提供的数组大小小于要求的大小,则会反身创建一个新的数组。

在您的情况下,大小为零的数组是不可变的,因此可以安全地将其提升为静态最终变量,这可以使您的代码更简洁一些,从而避免了在每次调用时创建该数组。无论如何,都会在方法内部创建一个新数组,因此这是可读性的优化。

可以说,更快的版本是传递正确大小的数组,但除非可以证明此代码是性能瓶颈,否则除非可读性强,否则应优先考虑可读性而不是运行时性能。


2

第一种情况更有效。

那是因为在第二种情况下:

MyClass[] arr = myList.toArray(new MyClass[0]);

运行时实际上会创建一个空数组(大小为零),然后在toArray方法内部创建另一个数组以适合实际数据。使用以下代码(取自jdk1.5.0_10)使用反射完成创建:

public <T> T[] toArray(T[] a) {
    if (a.length < size)
        a = (T[])java.lang.reflect.Array.
    newInstance(a.getClass().getComponentType(), size);
System.arraycopy(elementData, 0, a, 0, size);
    if (a.length > size)
        a[size] = null;
    return a;
}

通过使用第一种形式,您可以避免创建第二个数组,也可以避免使用反射代码。


toArray()不使用反射。无论如何,至少只要您不算“投射”到反射即可;-)。
Georgi

toArray(T [])可以。它需要创建适当类型的数组。现代JVM将这种反射优化为与非反射版本大致相同的速度。
Tom Hawtin-大头钉

我认为它确实使用了反射。JDK 1.5.0_10可以肯定地做到这一点,而反射是我知道创建在编译时不知道的类型的数组的唯一方法。
Panagiotis Korros

然后,她的一个源代码示例(上面的一个或我的一个)已过时。可悲的是,我没有找到适合我的子版本号。
Georgi

1
Georgi,您的代码来自JDK 1.6,如果您看到Arrays.copyTo方法的实现,您将看到该实现使用反射。
Panagiotis Korros

-1

第二个是微乎其微的可读性,但是几乎没有什么改进是不值得的。第一种方法更快,在运行时没有缺点,所以这就是我使用的方法。但是我用第二种方式编写它,因为键入速度更快。然后,我的IDE会将其标记为警告,并提出对其进行修复。只需一次按键,它将代码从第二种类型转换为第一种类型。


-2

将'toArray'与正确大小的数组一起使用会更好,因为替代方法将首先创建零大小的数组,然后创建正确大小的数组。但是,正如您所说,差异可能微不足道。

另外,请注意,javac编译器不会执行任何优化。如今,所有优化都由JIT / HotSpot编译器在运行时执行。我不知道任何JVM中围绕“ toArray”进行的任何优化。

因此,问题的答案很大程度上取决于样式,但出于一致性的考虑,应成为您遵守的任何编码标准的一部分(无论是有文件证明的还是其他形式的证明)。


OTOH,如果标准是使用零长度数组,则出现偏差的情况表明性能是一个问题。
Michael Scheper

-5

整数的示例代码:

Integer[] arr = myList.toArray(new integer[0]);
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.