Python-创建具有初始容量的列表

187

像这样的代码经常发生：

l = []
while foo:
    #baz
    l.append(bar)
    #qux

如果您要将数千个元素添加到列表中，这真的很慢，因为必须不断调整列表的大小以适应新元素。

在Java中，您可以创建具有初始容量的ArrayList。如果您知道列表的大小，这将大大提高效率。

我知道这样的代码通常可以重构为列表理解。但是，如果for / while循环非常复杂，则这是不可行的。我们的Python程序员有什么对等的地方吗？

— 克劳迪乌
source

12

据我所知，它们与ArrayLists相似之处在于它们每次都将其大小加倍。此操作的摊销时间是恒定的。它并没有像您想的那样严重影响性能。

— mmcdole

好像你是对的！

— 克劳迪（Claudiu）

10

在OP的场景中，可能不一定需要预先初始化，但有时确实需要预先初始化：我有许多需要在特定索引处插入的预索引项目，但是它们是乱序的。我需要提前增加列表以避免IndexErrors。谢谢这个问题。

— 尼尔·特拉夫特

1

@Claudiu接受的答案具有误导性。其下最高评价的评论解释了原因。您会考虑接受其他答案之一吗？

— Neal Gokli '18

126

def doAppend( size=10000 ):
    result = []
    for i in range(size):
        message= "some unique object %d" % ( i, )
        result.append(message)
    return result

def doAllocate( size=10000 ):
    result=size*[None]
    for i in range(size):
        message= "some unique object %d" % ( i, )
        result[i]= message
    return result

结果。（评估每个功能144次并平均持续时间）

simple append 0.0102
pre-allocate  0.0098

结论。没关系。

过早的优化是万恶之源。

— 洛特
source

18

如果预分配方法（size * [None]）本身效率低下怎么办？python VM是否实际上一次分配列表，还是逐渐增加列表，就像append（）一样？

— haridsv

9

嘿。它大概可以用Python表示，但是还没有人在这里发布它。haridsv的观点是，我们只是假设“ int * list”不只是逐项追加到列表中。这个假设可能是正确的，但是haridsv的观点是我们应该检查这一点。如果这是无效的，那可以解释为什么您显示的两个函数花费几乎相同的时间-因为在幕后，他们做的是完全相同的事情，因此实际上并未测试该问题的主题。最好的祝福！

— 乔纳森·哈特利

135

这是无效的；您将在每次迭代中格式化字符串，这相对于您要测试的内容而言将永远耗时。此外，鉴于4％仍然取决于情况，这是一个低估的情况……

— Philip Guin 2012年

39

正如@Philip指出的那样，这里的结论具有误导性。这里的预分配无关紧要，因为字符串格式化操作很昂贵。我在循环中用便宜的操作进行了测试，发现预分配几乎快了一倍。

— 基思

11

多次投票的错误答案是所有邪恶的另一个根源。

— 桥本

79

Python列表没有内置的预分配。如果您确实需要列出清单，并且需要避免附加的开销（并且您应该验证这样做），则可以执行以下操作：

l = [None] * 1000 # Make a list of 1000 None's
for i in xrange(1000):
    # baz
    l[i] = bar
    # qux

也许您可以通过使用生成器来避免使用此列表：

def my_things():
    while foo:
        #baz
        yield bar
        #qux

for thing in my_things():
    # do something with thing

这样，列表并不会全部存储在内存中，而只是根据需要生成。

— 内德·巴切尔德
source

7

+1生成器而不是列表。可以对许多算法进行略微修改，以使用生成器而不是完全实现的列表。

— S.Lott

发电机是个好主意，是的。除了原地设置之外，我还想要一种通用的方法。我想差别很小，thoguh。

— Claudiu）

50

短版：使用

pre_allocated_list = [None] * size

预先分配一个列表（也就是说，能够解决列表的“大小”元素，而不是通过追加逐步形成列表）。即使在大型列表上，此操作也非常快。分配新对象，这些对象以后将分配给列表元素，将花费更长的时间，并且在性能方面将成为程序中的瓶颈。

长版：

我认为应该考虑初始化时间。由于在python中所有内容都是引用，因此将每个元素设置为None还是某个字符串都没关系-两种方式都只是引用。如果要为每个要引用的元素创建新对象，则将花费更长的时间。

对于Python 3.2：

import time
import copy

def print_timing (func):
  def wrapper (*arg):
    t1 = time.time ()
    res = func (*arg)
    t2 = time.time ()
    print ("{} took {} ms".format (func.__name__, (t2 - t1) * 1000.0))
    return res

  return wrapper

@print_timing
def prealloc_array (size, init = None, cp = True, cpmethod=copy.deepcopy, cpargs=(), use_num = False):
  result = [None] * size
  if init is not None:
    if cp:
      for i in range (size):
          result[i] = init
    else:
      if use_num:
        for i in range (size):
            result[i] = cpmethod (i)
      else:
        for i in range (size):
            result[i] = cpmethod (cpargs)
  return result

@print_timing
def prealloc_array_by_appending (size):
  result = []
  for i in range (size):
    result.append (None)
  return result

@print_timing
def prealloc_array_by_extending (size):
  result = []
  none_list = [None]
  for i in range (size):
    result.extend (none_list)
  return result

def main ():
  n = 1000000
  x = prealloc_array_by_appending(n)
  y = prealloc_array_by_extending(n)
  a = prealloc_array(n, None)
  b = prealloc_array(n, "content", True)
  c = prealloc_array(n, "content", False, "some object {}".format, ("blah"), False)
  d = prealloc_array(n, "content", False, "some object {}".format, None, True)
  e = prealloc_array(n, "content", False, copy.deepcopy, "a", False)
  f = prealloc_array(n, "content", False, copy.deepcopy, (), False)
  g = prealloc_array(n, "content", False, copy.deepcopy, [], False)

  print ("x[5] = {}".format (x[5]))
  print ("y[5] = {}".format (y[5]))
  print ("a[5] = {}".format (a[5]))
  print ("b[5] = {}".format (b[5]))
  print ("c[5] = {}".format (c[5]))
  print ("d[5] = {}".format (d[5]))
  print ("e[5] = {}".format (e[5]))
  print ("f[5] = {}".format (f[5]))
  print ("g[5] = {}".format (g[5]))

if __name__ == '__main__':
  main()

评价：

prealloc_array_by_appending took 118.00003051757812 ms
prealloc_array_by_extending took 102.99992561340332 ms
prealloc_array took 3.000020980834961 ms
prealloc_array took 49.00002479553223 ms
prealloc_array took 316.9999122619629 ms
prealloc_array took 473.00004959106445 ms
prealloc_array took 1677.9999732971191 ms
prealloc_array took 2729.999780654907 ms
prealloc_array took 3001.999855041504 ms
x[5] = None
y[5] = None
a[5] = None
b[5] = content
c[5] = some object blah
d[5] = some object 5
e[5] = a
f[5] = []
g[5] = ()

如您所见，仅列出对同一None对象的大量引用就花费很少的时间。

前置或扩展花费的时间更长（我没有平均任何东西，但是运行几次后，我可以告诉您扩展和附加花费的时间大致相同）。

为每个元素分配新对象-这是最耗时的时间。S.Lott的答案就是这样做-每次都格式化一个新字符串。这不是严格要求的-如果要预分配一些空间，只需列出一个None，然后随意将数据分配给list元素。不管是在创建列表时还是在创建列表之后生成数据，用哪种方式生成数据都比添加/扩展列表花费更多的时间。但是，如果您想要一个人口稀少的列表，那么从“无”列表开始肯定会更快。

— LRN
source

嗯，很有趣。因此，答案不多-您是否在进行将元素放入列表中的任何操作并不重要，但是，如果您只想包含所有相同元素的大列表，则应使用此[]*方法

— Claudiu

26

使用Python的方式是：

x = [None] * numElements

或您希望预先弹出的任何默认值，例如

bottles = [Beer()] * 99
sea = [Fish()] * many
vegetarianPizzas = [None] * peopleOrderingPizzaNotQuiche

[编辑：买者自负的[Beer()] * 99语法创建一个 Beer，然后填充与99次的引用数组相同的单个实例]

Python的默认方法可能非常有效，尽管随着您增加元素数量，效率会下降。

比较

import time

class Timer(object):
    def __enter__(self):
        self.start = time.time()
        return self

    def __exit__(self, *args):
        end = time.time()
        secs = end - self.start
        msecs = secs * 1000  # millisecs
        print('%fms' % msecs)

Elements   = 100000
Iterations = 144

print('Elements: %d, Iterations: %d' % (Elements, Iterations))


def doAppend():
    result = []
    i = 0
    while i < Elements:
        result.append(i)
        i += 1

def doAllocate():
    result = [None] * Elements
    i = 0
    while i < Elements:
        result[i] = i
        i += 1

def doGenerator():
    return list(i for i in range(Elements))


def test(name, fn):
    print("%s: " % name, end="")
    with Timer() as t:
        x = 0
        while x < Iterations:
            fn()
            x += 1


test('doAppend', doAppend)
test('doAllocate', doAllocate)
test('doGenerator', doGenerator)

与

#include <vector>
typedef std::vector<unsigned int> Vec;

static const unsigned int Elements = 100000;
static const unsigned int Iterations = 144;

void doAppend()
{
    Vec v;
    for (unsigned int i = 0; i < Elements; ++i) {
        v.push_back(i);
    }
}

void doReserve()
{
    Vec v;
    v.reserve(Elements);
    for (unsigned int i = 0; i < Elements; ++i) {
        v.push_back(i);
    }
}

void doAllocate()
{
    Vec v;
    v.resize(Elements);
    for (unsigned int i = 0; i < Elements; ++i) {
        v[i] = i;
    }
}

#include <iostream>
#include <chrono>
using namespace std;

void test(const char* name, void(*fn)(void))
{
    cout << name << ": ";

    auto start = chrono::high_resolution_clock::now();
    for (unsigned int i = 0; i < Iterations; ++i) {
        fn();
    }
    auto end = chrono::high_resolution_clock::now();

    auto elapsed = end - start;
    cout << chrono::duration<double, milli>(elapsed).count() << "ms\n";
}

int main()
{
    cout << "Elements: " << Elements << ", Iterations: " << Iterations << '\n';

    test("doAppend", doAppend);
    test("doReserve", doReserve);
    test("doAllocate", doAllocate);
}

在我的Windows 7 i7上，64位Python提供

Elements: 100000, Iterations: 144
doAppend: 3587.204933ms
doAllocate: 2701.154947ms
doGenerator: 1721.098185ms

尽管C ++提供（使用MSVC构建，64位，启用了优化）

Elements: 100000, Iterations: 144
doAppend: 74.0042ms
doReserve: 27.0015ms
doAllocate: 5.0003ms

C ++调试版本产生：

Elements: 100000, Iterations: 144
doAppend: 2166.12ms
doReserve: 2082.12ms
doAllocate: 273.016ms

这里的要点是，使用Python可以将性能提高7-8％，并且如果您认为自己正在编写高性能的应用程序（或者正在编写用于Web服务的内容或其他内容），那么这是不容小at的，但是您可能需要重新考虑您选择的语言。

另外，这里的Python代码并不是真正的Python代码。在此切换到真正的Pythonesque代码可提供更好的性能：

import time

class Timer(object):
    def __enter__(self):
        self.start = time.time()
        return self

    def __exit__(self, *args):
        end = time.time()
        secs = end - self.start
        msecs = secs * 1000  # millisecs
        print('%fms' % msecs)

Elements   = 100000
Iterations = 144

print('Elements: %d, Iterations: %d' % (Elements, Iterations))


def doAppend():
    for x in range(Iterations):
        result = []
        for i in range(Elements):
            result.append(i)

def doAllocate():
    for x in range(Iterations):
        result = [None] * Elements
        for i in range(Elements):
            result[i] = i

def doGenerator():
    for x in range(Iterations):
        result = list(i for i in range(Elements))


def test(name, fn):
    print("%s: " % name, end="")
    with Timer() as t:
        fn()


test('doAppend', doAppend)
test('doAllocate', doAllocate)
test('doGenerator', doGenerator)

这使

Elements: 100000, Iterations: 144
doAppend: 2153.122902ms
doAllocate: 1346.076965ms
doGenerator: 1614.092112ms

（在32位中，doGenerator比doAllocate做得更好）。

在这里，doAppend和doAllocate之间的差距明显更大。

显然，这里的差异仅适用于您执行多次以上的操作，或者在负载较重的系统上执行的操作，这些数据将按数量级进行扩展，或者正在处理更大的清单。

这里的重点是：用pythonic方式获得最佳性能。

但是，如果您担心常规的高级性能，则Python是错误的语言。最根本的问题是，由于装饰器等（https://wiki.python.org/moin/PythonSpeed/PerformanceTips#Data_Aggregation#Data_Aggregation）等Python功能，Python函数调用传统上比其他语言慢300倍。

— 酮
source

@NilsvonBarth C ++没有timeit

— kfsone

Python具有timeit，您在计时Python代码时应使用；显然，我不是在谈论C ++。

— 尼尔斯·冯·巴斯

4

这不是正确的答案。bottles = [Beer()] * 99不会创建99个Beer对象。而是创建一个带有99个引用的Beer对象。如果您要对其进行突变，则列表中的所有元素都将发生突变，原因(bottles[i] is bootles[j]) == True是every i != j. 0<= i, j <= 99。

— erhesto

@erhesto您认为答案不正确，因为作者使用参考作为示例来填充列表？首先，没有人需要创建99个Beer对象（相对于一个对象和99个引用）。在人口密集的情况下（他所说的），速度越快越好，因为稍后将替换该值。其次，答案根本不涉及参考或突变。您错过了大局。

— 吴永伟'18

@YongweiWu您说得对，实际上是对的。这个例子并不能使整个答案不正确，这可能只是误导，值得一提。

— erhesto

8

正如其他人提到的那样，最简单的方法是预先植入带有NoneType对象的列表。

话虽这么说，您应该先了解Python列表的实际工作方式，然后再决定是否需要这样做。在列表的CPython实现中，始终在开销空间的情况下创建底层数组，并且数组的大小逐渐变大( 4, 8, 16, 25, 35, 46, 58, 72, 88, 106, 126, 148, 173, 201, 233, 269, 309, 354, 405, 462, 526, 598, 679, 771, 874, 990, 1120, etc)，因此几乎不经常调整列表的大小。

由于这种行为，大多数 list.append()功能O(1)对于追加而言都是复杂的，仅当跨越这些边界之一时才具有增加的复杂度，此时复杂度将为O(n)。这种行为导致S. Lott的答案中执行时间的最小增加。

资料来源：http : //www.laurentluce.com/posts/python-list-implementation/

— 罗素·特罗塞尔（Russell Troxel）
source

4

我运行@ s.lott的代码，并通过预分配产生了10％的相同性能提升。使用生成器尝试了@jeremy的想法，并且能够比doAllocate更好地看到gen的性能。对于我的项目，10％的改善很重要，因此感谢大家，因为这对我们有很大帮助。

def doAppend( size=10000 ):
    result = []
    for i in range(size):
        message= "some unique object %d" % ( i, )
        result.append(message)
    return result

def doAllocate( size=10000 ):
    result=size*[None]
    for i in range(size):
        message= "some unique object %d" % ( i, )
        result[i]= message
    return result

def doGen( size=10000 ):
    return list("some unique object %d" % ( i, ) for i in xrange(size))

size=1000
@print_timing
def testAppend():
    for i in xrange(size):
        doAppend()

@print_timing
def testAlloc():
    for i in xrange(size):
        doAllocate()

@print_timing
def testGen():
    for i in xrange(size):
        doGen()


testAppend()
testAlloc()
testGen()

testAppend took 14440.000ms
testAlloc took 13580.000ms
testGen took 13430.000ms

— 杰森·维纳（Jason Wiener）
source

5

“对我的项目而言10％的改善很重要”？真？您可以证明该名单分配的瓶颈？我想了解更多。您是否有一个博客可以解释这实际上有何帮助？

— S.Lott

2

@ S.Lott尝试将大小增加一个数量级；性能下降了3个数量级（与C ++相比，性能下降的幅度比单个数量级略大）。

— kfsone 2014年

2

可能是这种情况，因为随着数组的增长，它可能必须在内存中移动。（想想如何将一个接一个的对象存储在那里。）

— Evgeni Sergeev

3

如果您使用的numpy具有更多类似C的数组，则会引起对Python中预分配的担忧。在这种情况下，预分配问题与数据的形状和默认值有关。

如果要在大量列表上进行数值计算并需要性能，请考虑使用numpy。

— J450n
source

0

对于某些应用程序，词典可能是您所需要的。例如，在find_totient方法中，我发现使用字典更方便，因为我没有零索引。

def totient(n):
    totient = 0

    if n == 1:
        totient = 1
    else:
        for i in range(1, n):
            if math.gcd(i, n) == 1:
                totient += 1
    return totient

def find_totients(max):
    totients = dict()
    for i in range(1,max+1):
        totients[i] = totient(i)

    print('Totients:')
    for i in range(1,max+1):
        print(i,totients[i])

这个问题也可以通过预先分配的列表来解决：

def find_totients(max):
    totients = None*(max+1)
    for i in range(1,max+1):
        totients[i] = totient(i)

    print('Totients:')
    for i in range(1,max+1):
        print(i,totients[i])

我觉得这不是那么优雅，而且容易出错，因为我存储的None会在我不小心使用错误的情况下引发异常，并且因为我需要考虑地图可以避免的边缘情况。

确实，字典的效率不高，但是正如其他人所评论的那样，速度的微小差异并不总会带来重大的维护风险。

— 乔西亚·约德（Josiah Yoder）
source

-1

据我了解，python列表已经与ArrayLists非常相似。但是，如果您想调整这些参数，我会在网上发现这篇帖子可能很有趣（基本上，只需创建自己的ScalableList扩展名即可）：

http://mail.python.org/pipermail/python-list/2000-May/035082.html

— 皮特·莱斯尼克（Piotr Lesnicki）
source