将两个列表转换成字典

1226

想象一下您有：

keys = ['name', 'age', 'food']
values = ['Monty', 42, 'spam']

产生以下字典的最简单方法是什么？

a_dict = {'name' : 'Monty', 'age' : 42, 'food' : 'spam'}

python list dictionary

— 圭多
source

2139

像这样：

>>> keys = ['a', 'b', 'c']
>>> values = [1, 2, 3]
>>> dictionary = dict(zip(keys, values))
>>> print(dictionary)
{'a': 1, 'b': 2, 'c': 3}

Voila :-)成对的dict构造函数和zip函数非常有用：https：//docs.python.org/3/library/functions.html#func-dict

— 丹·伦斯基
source

3

值得注意的是，这是dictionary = {zip(keys, values)}行不通的。您必须明确声明为dict(...)

— Fernando Wittmann，

5

不知道为什么您会期望它，@ FernandoWittmann。{thing}是一种语法糖，可构成set()一个元素。{*iterable}是句法糖来构造一个set包含几个元素的。{k:v}或{**mapping} 将构造一个dict，但是从语法上讲非常不同。

— 丹·伦斯基

6

感谢Dan的评论。你是对的。之所以发生混乱，是因为我通常将sintax {}用于字典。实际上，如果我们尝试type({})输出为dict。但是的确，如果我们尝试，type({thing})则输出为set。

— 费尔南多·威特曼

我来这里是为了可以做得更好{k:v for k, v in zip(keys, values)}。事实证明我们可以。+1。

— JG

139

想象一下您有：

keys = ('name', 'age', 'food')
values = ('Monty', 42, 'spam')

产生以下字典的最简单方法是什么？

dict = {'name' : 'Monty', 'age' : 42, 'food' : 'spam'}

绩效最高的`dict`构造函数`zip`

new_dict = dict(zip(keys, values))

在Python 3中，zip现在返回一个惰性迭代器，这是目前性能最高的方法。

dict(zip(keys, values))确实需要为dict和进行一次性全局查找zip，但它不会形成任何不必要的中间数据结构，也不必在函数应用程序中处理局部查找。

亚军，dict理解：

使用dict构造函数的第二名是使用dict理解的本机语法（而不是列表理解，因为其他人错误地将其理解为）：

new_dict = {k: v for k, v in zip(keys, values)}

当您需要根据键或值进行映射或过滤时选择此选项。

在Python 2中，zip返回一个列表，以避免创建不必要的列表，请izip改用（别名为zip可以减少移至Python 3时的代码更改）。

from itertools import izip as zip

所以仍然是（2.7）：

new_dict = {k: v for k, v in zip(keys, values)}

Python 2，非常适合<= 2.6

izip从itertools变为zip在Python 3. izip大于拉链用于Python 2更好（因为它避免了不必要的列表创建），以及理想的2.6或以下：

from itertools import izip
new_dict = dict(izip(keys, values))

所有情况的结果：

在所有情况下：

>>> new_dict
{'age': 42, 'name': 'Monty', 'food': 'spam'}

说明：

如果我们查看帮助，dict就会发现它采用了多种形式的参数：


>>> help(dict)

class dict(object)
 |  dict() -> new empty dictionary
 |  dict(mapping) -> new dictionary initialized from a mapping object's
 |      (key, value) pairs
 |  dict(iterable) -> new dictionary initialized as if via:
 |      d = {}
 |      for k, v in iterable:
 |          d[k] = v
 |  dict(**kwargs) -> new dictionary initialized with the name=value pairs
 |      in the keyword argument list.  For example:  dict(one=1, two=2)

最佳方法是使用可迭代对象，同时避免创建不必要的数据结构。在Python 2中，zip创建了不必要的列表：

>>> zip(keys, values)
[('name', 'Monty'), ('age', 42), ('food', 'spam')]

在Python 3中，等效项为：

>>> list(zip(keys, values))
[('name', 'Monty'), ('age', 42), ('food', 'spam')]

Python 3 zip仅创建了一个可迭代的对象：

>>> zip(keys, values)
<zip object at 0x7f0e2ad029c8>

由于我们要避免创建不必要的数据结构，因此我们通常希望避免使用Python 2 zip（因为它创建了不必要的列表）。

性能较差的替代品：

这是一个传递给dict构造函数的生成器表达式：

generator_expression = ((k, v) for k, v in zip(keys, values))
dict(generator_expression)

或等效地：

dict((k, v) for k, v in zip(keys, values))

这是一个传递给dict构造函数的列表理解：

dict([(k, v) for k, v in zip(keys, values)])

在前两种情况下，在可迭代的zip上放置了一个额外的非操作（因此是不必要的）计算层，并且在列表理解的情况下，不必要地创建了一个额外的列表。我希望他们所有人的表现都不太好，当然也不会那么好。

绩效考核：

在Ubuntu 16.04上，由Nix提供的64位Python 3.8.2中，从最快到最慢的顺序是：

>>> min(timeit.repeat(lambda: dict(zip(keys, values))))
0.6695233230129816
>>> min(timeit.repeat(lambda: {k: v for k, v in zip(keys, values)}))
0.6941362579818815
>>> min(timeit.repeat(lambda: {keys[i]: values[i] for i in range(len(keys))}))
0.8782548159942962
>>> 
>>> min(timeit.repeat(lambda: dict([(k, v) for k, v in zip(keys, values)])))
1.077607496001292
>>> min(timeit.repeat(lambda: dict((k, v) for k, v in zip(keys, values))))
1.1840861019445583

dict(zip(keys, values)) 即使使用少量键和值也能获胜，但对于较大的键和值，则性能差异会更大。

评论者说：

min似乎是比较效果的一种坏方法。当然mean和/或max将是更有用的实际使用指标。

我们使用min这些算法是因为它们是确定性的。我们想知道算法在最佳条件下的性能。

如果操作系统由于任何原因挂起，则与我们要比较的内容无关，因此我们需要从分析中排除这些结果。

如果使用mean，这些事件将大大扭曲我们的结果，而如果使用，max我们将只会得到最极端的结果-最有可能受此类事件影响的结果。

评论者还说：

在python 3.6.8中，使用平均值，对dict的理解确实仍然更快，对于这些小列表而言，大约30％。对于较大的列表（10k个随机数），dict通话速度大约快10％。

我想我们的意思是dict(zip(...10k随机数。听起来确实是一个非常不寻常的用例。确实有道理，最直接的调用将在大型数据集中占主导地位，并且考虑到运行该测试将花费多长时间，进而使您的数字发生偏差，如果操作系统挂起占主导地位，我也不会感到惊讶。如果您使用mean或max我会认为您的结果毫无意义。

让我们在上面的示例中使用更实际的尺寸：

import numpy
import timeit
l1 = list(numpy.random.random(100))
l2 = list(numpy.random.random(100))

而且我们在这里看到，dict(zip(...对于较大的数据集，确实可以更快地运行约20％。

>>> min(timeit.repeat(lambda: {k: v for k, v in zip(l1, l2)}))
9.698965263989521
>>> min(timeit.repeat(lambda: dict(zip(l1, l2))))
7.9965161079890095

— 亚伦·霍尔
source

1

截至2019年中（python 3.7.3），我发现了不同的时间安排。%% timeit返回1.57 \ pm 0.019 dict(zip(headList, textList))微秒和1.95 \ pm 0.030微秒{k: v for k, v in zip(headList, textList)}。我建议使用前者以提高可读性和速度。显然，这是针对timeit的min（）vs mean（）参数的。

— Mark_Anderson

1

min似乎是比较效果的一种坏方法。当然mean和/或max将是更有用的实际使用指标。

— naught101 '19

1

在python 3.6.8中，使用平均值，对dict的理解确实仍然更快，对于这些小列表而言，大约30％。对于较大的列表（10k个随机数），dict通话速度大约快10％。

— naught101 '19

@ naught101-我回答了您的评论。

— 亚伦·霍尔

3

1万个数字只是生成2个长串独特元素的快速方法。列表生成是在时序估计之外进行的。//您为什么认为平均值或最大值无用？如果您执行多次，那么您的平均时间为〜n * mean，上限为〜n * max。您的最小值提供了一个下限，但是大多数人关心平均或最差情况的性能。如果方差很大，则您的最小值在大多数情况下将完全不具有代表性。在现实世界中，最低要求如何更有意义？

— naught101 '19

128

尝试这个：

>>> import itertools
>>> keys = ('name', 'age', 'food')
>>> values = ('Monty', 42, 'spam')
>>> adict = dict(itertools.izip(keys,values))
>>> adict
{'food': 'spam', 'age': 42, 'name': 'Monty'}

在Python 2中，与相比，它在内存消耗方面更经济zip。

— 迈克·戴维斯
source

18

对于Python2是正确的，但是在Python 3中，zip内存消耗已经很经济了。docs.python.org/3/library/functions.html#zip事实上，你可以看到，six使用zip在Python 3，以取代itertools.izip在Python 2 pythonhosted.org/six。

— Pedro Cattori

35

>>> keys = ('name', 'age', 'food')
>>> values = ('Monty', 42, 'spam')
>>> dict(zip(keys, values))
{'food': 'spam', 'age': 42, 'name': 'Monty'}

— y
source

28

您还可以在≥2.7的Python中使用字典理解：

>>> keys = ('name', 'age', 'food')
>>> values = ('Monty', 42, 'spam')
>>> {k: v for k, v in zip(keys, values)}
{'food': 'spam', 'age': 42, 'name': 'Monty'}

— 布伦丹·伯格
source

17

一种更自然的方法是使用字典理解

keys = ('name', 'age', 'food')
values = ('Monty', 42, 'spam')    
dict = {keys[i]: values[i] for i in range(len(keys))}

— 波尔拉·法塔
source

有时候，这是最快的方法，有时是最慢的转换为dict对象，为什么会这样呢？

— Haritsinh Gohil

13

如果需要在创建字典之前转换键或值，则可以使用生成器表达式。例：

>>> adict = dict((str(k), v) for k, v in zip(['a', 1, 'b'], [2, 'c', 3]))

看看像Pythonista一样的代码：惯用Python。

— f
source

10

使用Python 3.x进行dict理解

keys = ('name', 'age', 'food')
values = ('Monty', 42, 'spam')

dic = {k:v for k,v in zip(keys, values)}

print(dic)

有关dict理解的更多信息，这里有一个示例：

>>> print {i : chr(65+i) for i in range(4)}
    {0 : 'A', 1 : 'B', 2 : 'C', 3 : 'D'}

— 基里洛夫
source

8

对于那些需要简单代码并且不熟悉的人zip：

List1 = ['This', 'is', 'a', 'list']
List2 = ['Put', 'this', 'into', 'dictionary']

这可以通过一行代码来完成：

d = {List1[n]: List2[n] for n in range(len(List1))}

— 开发协议
source

6

失败List1时间长于List2

— 让-弗朗索瓦·法布尔

@Jean-FrançoisFabre真的很重要吗？我们应该提供两个长度不同的列表来构建字典的原因是什么？

— love.by.Jesus

可能不是，但这for n in range(len(List1))是一种反模式

— 让-弗朗索瓦·法布尔

3

2018-04-18

最好的解决方案仍然是：

In [92]: keys = ('name', 'age', 'food')
...: values = ('Monty', 42, 'spam')
...: 

In [93]: dt = dict(zip(keys, values))
In [94]: dt
Out[94]: {'age': 42, 'food': 'spam', 'name': 'Monty'}

整理一下：

    lst = [('name', 'Monty'), ('age', 42), ('food', 'spam')]
    keys, values = zip(*lst)
    In [101]: keys
    Out[101]: ('name', 'age', 'food')
    In [102]: values
    Out[102]: ('Monty', 42, 'spam')

— 结石
source

2

您可以使用以下代码：

dict(zip(['name', 'age', 'food'], ['Monty', 42, 'spam']))

但是请确保列表的长度相同。如果长度不相同，则zip函数会将较长的列表进行分类。

— 阿卡什·纳亚克（Akash Nayak）
source

2

我在尝试解决与图形相关的问题时有这个疑问。我遇到的问题是我需要定义一个空的邻接列表，并想用一个空列表初始化所有节点，那是当我想到如何检查它是否足够快时，我的意思是说值得进行zip操作而不是简单的分配键值对。在大多数情况下，时间因素是重要的破冰者。因此，我对两种方法都执行了timeit操作。

import timeit
def dictionary_creation(n_nodes):
    dummy_dict = dict()
    for node in range(n_nodes):
        dummy_dict[node] = []
    return dummy_dict


def dictionary_creation_1(n_nodes):
    keys = list(range(n_nodes))
    values = [[] for i in range(n_nodes)]
    graph = dict(zip(keys, values))
    return graph


def wrapper(func, *args, **kwargs):
    def wrapped():
        return func(*args, **kwargs)
    return wrapped

iteration = wrapper(dictionary_creation, n_nodes)
shorthand = wrapper(dictionary_creation_1, n_nodes)

for trail in range(1, 8):
    print(f'Itertion: {timeit.timeit(iteration, number=trails)}\nShorthand: {timeit.timeit(shorthand, number=trails)}')

对于n_nodes = 10,000,000我得到了，

迭代：2.825081646999024速记：3.535717916001886

迭代：5.051560923002398速记：6.255070794999483

迭代：6.52859034499852速记：8.221581164998497

迭代：8.683652416999394速记：12.599181543999293

迭代：11.587241565001023速记：15.27298851100204

迭代：14.816342867001367速记：17.162912737003353

迭代：16.645022411001264速记：19.976680120998935

您可以清楚地看到在某一点之后，第n_步的迭代方法超过了第n-1_步的速记方法所花费的时间。

— Mayank Prakash
source

1

这也是在字典中添加列表值的示例

list1 = ["Name", "Surname", "Age"]
list2 = [["Cyd", "JEDD", "JESS"], ["DEY", "AUDIJE", "PONGARON"], [21, 32, 47]]
dic = dict(zip(list1, list2))
print(dic)

始终确保您的“键”（list1）始终在第一个参数中。

{'Name': ['Cyd', 'JEDD', 'JESS'], 'Surname': ['DEY', 'AUDIJE', 'PONGARON'], 'Age': [21, 32, 47]}

— 赛德
source

0

作为字典理解的解决方案，带有枚举：

dict = {item : values[index] for index, item in enumerate(keys)}

与枚举循环的解决方案：

dict = {}
for index, item in enumerate(keys):
    dict[item] = values[index]

— jay123
source

0

您也可以尝试将两个列表组合在一起的一个列表；）

a = [1,2,3,4]
n = [5,6,7,8]

x = []
for i in a,n:
    x.append(i)

print(dict(zip(x[0], x[1])))

— 拉汉·拉玛瓦特（Lakhan Ramawat）
source

-1

没有zip功能的方法

l1 = [1,2,3,4,5]
l2 = ['a','b','c','d','e']
d1 = {}
for l1_ in l1:
    for l2_ in l2:
        d1[l1_] = l2_
        l2.remove(l2_)
        break  

print (d1)


{1: 'd', 2: 'b', 3: 'e', 4: 'a', 5: 'c'}

— 西雨瑞
source

xiyurui，您好：输入（l1和l2）应该是一个列表。如果将l1和l2分配为一组，则可能不会保留插入顺序。对我来说，我得到的输出为{1：'a'，2：'c'，3：'d'，4：'b'，5：'e'}

— Nursnaaz

将两个列表转换成字典

绩效最高的dict构造函数zip

亚军，dict理解：

Python 2，非常适合<= 2.6

所有情况的结果：

说明：

性能较差的替代品：

绩效考核：

绩效最高的`dict`构造函数`zip`