如何使用Python的timeit计时代码段以测试性能？

162

我有一个Python脚本，该脚本可以正常工作，但是我需要编写执行时间。我已经用谷歌搜索了，timeit但是我似乎无法使它正常工作。

我的Python脚本如下所示：

import sys
import getopt
import timeit
import random
import os
import re
import ibm_db
import time
from string import maketrans
myfile = open("results_update.txt", "a")

for r in range(100):
    rannumber = random.randint(0, 100)

    update = "update TABLE set val = %i where MyCount >= '2010' and MyCount < '2012' and number = '250'" % rannumber
    #print rannumber

    conn = ibm_db.pconnect("dsn=myDB","usrname","secretPWD")

for r in range(5):
    print "Run %s\n" % r        
    ibm_db.execute(query_stmt)
 query_stmt = ibm_db.prepare(conn, update)

myfile.close()
ibm_db.close(conn)

我需要的是执行查询并将其写入文件所需的时间results_update.txt。目的是测试具有不同索引和调整机制的数据库更新语句。

— 梅斯蒂卡
source

您的问题是/特定的timeit吗？我猜不会。在这种情况下，您可能应该从标题中删除“ with Pythons timeit”。

— 马丁·托马

275

您可以在要计时的块之前或之后使用time.time()或time.clock()。

import time

t0 = time.time()
code_block
t1 = time.time()

total = t1-t0

此方法不完全准确timeit（它不会平均运行几次），但很简单。

time.time()（在Windows和Linux中）和time.clock()（在Linux中）不够精确，无法实现快速功能（total = 0）。在这种情况下，或者如果要平均几次运行所花费的时间，则必须多次手动调用该函数（就像我在示例代码中已经做过的那样，并且在设置其number参数时timeit会自动执行）

import time

def myfast():
   code

n = 10000
t0 = time.time()
for i in range(n): myfast()
t1 = time.time()

total_n = t1-t0

如注释中所述，在Windows中，Corey time.clock()具有更高的精度（微秒而不是秒），并且优于time.time()。

— 华金
source

8

在Windows上fyi，请使用time.clock（）代替time.time（）

— Corey Goldberg 2010年

4

谢谢科里，为什么？是因为时钟更精确（微秒）还是更多？

— 华金2010年

11

您可以使用timeit.default_timer（）来使您的代码平台独立。它会根据操作系统返回time.clock（）或time.time（）。

— Marc Stober

6

与其手动选择一个时钟，不如使用timeit.default_timer；Python已经为您完成了工作。但是，实际上，您应该使用timeit.timeit(myfast, number=n)而不是重新发明重复的调用轮（并且会错过在timeit重复运行代码时禁用垃圾收集器的事实）。

— 马丁·彼得斯

15

更新：现在不建议使用time.clock（）。您现在应该使用time.time（）。实际上，从3.3版开始，最好的选择是time.perf_counter（）

— Madlozoz

42

如果您要分析代码并可以使用IPython，则它具有magic函数%timeit。

%%timeit 对细胞进行操作。

In [2]: %timeit cos(3.14)
10000000 loops, best of 3: 160 ns per loop

In [3]: %%timeit
   ...: cos(3.14)
   ...: x = 2 + 3
   ...: 
10000000 loops, best of 3: 196 ns per loop

— unk
source

36

除了时间之外，您显示的这段代码是完全错误的：您执行100个连接（完全忽略最后一个连接，而所有连接除外），然后在您执行第一个执行调用时，将其传递给本地变量query_stmt，该变量仅在执行后初始化呼叫。

首先，使您的代码正确，而不必担心时间安排：即建立或接收连接并对该连接执行100或500或任意数量的更新的函数，然后关闭该连接。一旦您的代码正常工作，便是考虑在其上使用的正确点timeit！

具体来说，如果要计时的函数是一个无参数的函数，则foobar可以使用timeit.timeit（2.6或更高版本-在2.5及更高版本中更为复杂）：

timeit.timeit('foobar()', number=1000)

您最好指定运行次数，因为对于您的用例而言，默认值（百万）可能会很高（导致在此代码中花费大量时间；-）。

— 亚历克斯·马特利
source

26

在最后几分钟为此苦苦挣扎之后，我想让未来的观众知道，如果您的函数foobar位于主文件中，则您可能还希望传递设置变量。像这样： timeit.timeit('foobar()','from __main__ import foobar',number=1000)

— Rich

3

在Python 2.7.8中，您可以简单地使用timeit.timeit( foobar, number=1000 )

9

专注于一件事。磁盘I / O速度很慢，因此如果您要调整的只是数据库查询，那么我将不进行测试。

而且，如果需要安排数据库执行时间，请改用数据库工具，例如询问查询计划，并注意性能不仅随确切的查询和拥有的索引而变化，还随数据负载（多少数据）而变化。您已存储）。

就是说，您只需将代码放入函数中，然后使用即可运行该函数timeit.timeit()：

def function_to_repeat():
    # ...

duration = timeit.timeit(function_to_repeat, number=1000)

这将禁用垃圾收集，重复调用该function_to_repeat()函数，并使用以下命令计时这些调用的总持续时间timeit.default_timer()，这是您特定平台上最准确的可用时钟。

您应该将设置代码移出重复功能；例如，您应该首先连接到数据库，然后仅对查询计时。使用setup参数导入或创建这些依赖项，并将其传递给函数：

def function_to_repeat(var1, var2):
    # ...

duration = timeit.timeit(
    'function_to_repeat(var1, var2)',
    'from __main__ import function_to_repeat, var1, var2', 
    number=1000)

会抓取globals function_to_repeat，var1并var2从您的脚本中将其每次重复传递给函数。

— 马亭皮特斯
source

将代码放入函数中是我一直在寻找的步骤-因为仅将代码制成字符串，并且evaling不会飞向任何不完全琐碎的事情。thx

— javadba

2

我看到问题已经得到解答，但是我仍然想加2美分。

我也遇到过类似的情况，在这种情况下，我必须测试几种方法的执行时间，因此编写了一个小脚本，该脚本对其中编写的所有函数都调用timeit。

该脚本也可以在github gist上找到。

希望对您和其他人有帮助。

from random import random
import types

def list_without_comprehension():
    l = []
    for i in xrange(1000):
        l.append(int(random()*100 % 100))
    return l

def list_with_comprehension():
    # 1K random numbers between 0 to 100
    l = [int(random()*100 % 100) for _ in xrange(1000)]
    return l


# operations on list_without_comprehension
def sort_list_without_comprehension():
    list_without_comprehension().sort()

def reverse_sort_list_without_comprehension():
    list_without_comprehension().sort(reverse=True)

def sorted_list_without_comprehension():
    sorted(list_without_comprehension())


# operations on list_with_comprehension
def sort_list_with_comprehension():
    list_with_comprehension().sort()

def reverse_sort_list_with_comprehension():
    list_with_comprehension().sort(reverse=True)

def sorted_list_with_comprehension():
    sorted(list_with_comprehension())


def main():
    objs = globals()
    funcs = []
    f = open("timeit_demo.sh", "w+")

    for objname in objs:
        if objname != 'main' and type(objs[objname]) == types.FunctionType:
            funcs.append(objname)
    funcs.sort()
    for func in funcs:
        f.write('''echo "Timing: %(funcname)s"
python -m timeit "import timeit_demo; timeit_demo.%(funcname)s();"\n\n
echo "------------------------------------------------------------"
''' % dict(
                funcname = func,
                )
            )

    f.close()

if __name__ == "__main__":
    main()

    from os import system

    #Works only for *nix platforms
    system("/bin/bash timeit_demo.sh")

    #un-comment below for windows
    #system("cmd timeit_demo.sh")

— 阿比吉特·马马尔德（Abhijit Mamarde）
source

2

这是史蒂文的答案的简单包装。该函数不会重复运行/求平均值，只是使您不必在任何地方重复计时代码即可：)

'''function which prints the wall time it takes to execute the given command'''
def time_func(func, *args): #*args can take 0 or more 
  import time
  start_time = time.time()
  func(*args)
  end_time = time.time()
  print("it took this long to run: {}".format(end_time-start_time))

— information_interchange
source

0

测试套件没有尝试使用导入的程序，timeit因此很难说出意图是什么。但是，这是一个规范的答案，因此timeit似乎有一个完整的例子，详细说明了Martijn的答案。

提供的文档timeit提供了许多示例和标志，值得一试。命令行的基本用法是：

$ python -mtimeit "all(True for _ in range(1000))"
2000 loops, best of 5: 161 usec per loop
$ python -mtimeit "all([True for _ in range(1000)])"
2000 loops, best of 5: 116 usec per loop

运行-h以查看所有选项。Python MOTW的精彩部分timeit展示了如何通过命令行中的导入和多行代码字符串运行模块。

在脚本形式中，我通常这样使用它：

import argparse
import copy
import dis
import inspect
import random
import sys
import timeit

def test_slice(L):
    L[:]

def test_copy(L):
    L.copy()

def test_deepcopy(L):
    copy.deepcopy(L)

if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("--n", type=int, default=10 ** 5)
    parser.add_argument("--trials", type=int, default=100)
    parser.add_argument("--dis", action="store_true")
    args = parser.parse_args()
    n = args.n
    trials = args.trials
    namespace = dict(L = random.sample(range(n), k=n))
    funcs_to_test = [x for x in locals().values() 
                     if callable(x) and x.__module__ == __name__]
    print(f"{'-' * 30}\nn = {n}, {trials} trials\n{'-' * 30}\n")

    for func in funcs_to_test:
        fname = func.__name__
        fargs = ", ".join(inspect.signature(func).parameters)
        stmt = f"{fname}({fargs})"
        setup = f"from __main__ import {fname}"
        time = timeit.timeit(stmt, setup, number=trials, globals=namespace)
        print(inspect.getsource(globals().get(fname)))

        if args.dis:
            dis.dis(globals().get(fname))

        print(f"time (s) => {time}\n{'-' * 30}\n")

您可以轻松添加所需的函数和参数。使用不纯函数时要小心，并要注意状态。

样本输出：

$ python benchmark.py --n 10000
------------------------------
n = 10000, 100 trials
------------------------------

def test_slice(L):
    L[:]

time (s) => 0.015502399999999972
------------------------------

def test_copy(L):
    L.copy()

time (s) => 0.01651419999999998
------------------------------

def test_deepcopy(L):
    copy.deepcopy(L)

time (s) => 2.136012
------------------------------

— 戈戈伦
source