我想创建一个随机的整数列表以进行测试。数字的分布并不重要。唯一要数的是时间。我知道生成随机数是一项耗时的任务,但是必须有更好的方法。
这是我当前的解决方案:
import random
import timeit
# Random lists from [0-999] interval
print [random.randint(0, 1000) for r in xrange(10)] # v1
print [random.choice([i for i in xrange(1000)]) for r in xrange(10)] # v2
# Measurement:
t1 = timeit.Timer('[random.randint(0, 1000) for r in xrange(10000)]', 'import random') # v1
t2 = timeit.Timer('random.sample(range(1000), 10000)', 'import random') # v2
print t1.timeit(1000)/1000
print t2.timeit(1000)/1000
v2比v1快,但无法大规模运行。它给出以下错误:
ValueError:样本大于总体
是否有一个快速,有效的解决方案能够在这种规模上工作?
答案的一些结果
安德鲁的:0.000290962934494
咬人:0.0058455221653
肯尼TM:0.00219276118279
NumPy来了,看到了,并被征服了。
random.sample()
耗尽了人口,使数字越来越不随机。一旦整个人口都枯竭,就不可能进一步取样。