如何用相同的键合并多个字典?


83

我有多个像这样的字典/键值对:

d1 = {key1: x1, key2: y1}  
d2 = {key1: x2, key2: y2}  

我希望结果成为新的字典(如果可能的话,以最有效的方式):

d = {key1: (x1, x2), key2: (y1, y2)}  

实际上,我希望结果d为:

d = {key1: (x1.x1attrib, x2.x2attrib), key2: (y1.y1attrib, y2.y2attrib)}  

如果有人告诉我如何获得第一个结果,那么我可以找出其余的结果。


3
@Salil:我们可以假设每个字典中都包含每个键吗?
比约恩博动

可能重复的合并Python字典
Johnsyweb

嗨,Space_C0wb0y,是的,所有字典中都有键。
Salil

指定所有字典是否具有相同的键绝对至关重要。
yugr

Answers:


43

假设所有键始终存在于所有字典中:

ds = [d1, d2]
d = {}
for k in d1.iterkeys():
    d[k] = tuple(d[k] for d in ds)

注意:在Python 3.x中,使用以下代码:

ds = [d1, d2]
d = {}
for k in d1.keys():
  d[k] = tuple(d[k] for d in ds)

并且如果dic包含numpy数组:

ds = [d1, d2]
d = {}
for k in d1.keys():
  d[k] = np.concatenate(list(d[k] for d in ds))

3
我认为只是“对于d1中的k”即可。
Salil

和d.get(k,None)代替d [k]
塔希尔,2013年

1
@tahir这意味着字典具有不匹配的键,因此迭代d1不正确(它可能会丢失其他字典中的键)。
yugr '18

1
对于python 3用户:d1.iterkeys()= d1.items()
莱利

在Python3.x中,它仍然对我不起作用。即使我的值不是数组,我也尝试过这样做,并且它可以工作。但是,输出的值将是数组。stackoverflow.com/questions/54040858/...
里克小号

73

这是一个通用解决方案,可以处理任意数量的字典,并且在某些字典中只有键的情况下:

from collections import defaultdict

d1 = {1: 2, 3: 4}
d2 = {1: 6, 3: 7}

dd = defaultdict(list)

for d in (d1, d2): # you can list as many input dicts as you want here
    for key, value in d.items():
        dd[key].append(value)

print(dd)

显示:

defaultdict(<type 'list'>, {1: [2, 6], 3: [4, 7]})

另外,要获取您的.attrib,只需更改append(value)append(value.attrib)


我认为OPtuple不需要这些值list
user225312

1
@AA:真的重要吗?在多个输入dict的更一般情况下,某些键并不存在的情况下,元组的构建将更加棘手,恕我直言
Eli Bendersky

1
然后,您可能需要进行正常操作dictdefaultdict以便dict对不存在的按键等具有正常的行为: dd = dict(dd)
Ned Deily

@Ned:好点,但是这取决于数据的最终使用
Eli Bendersky

@Eli:没关系,但我只是试图将其建立在OP想要的基础上,并希望能为您提供元组的解决方案:-)
user225312 2011年

4

如果只有d1和d2,

from collections import defaultdict

d = defaultdict(list)
for a, b in d1.items() + d2.items():
    d[a].append(b)

4
dict1 = {'m': 2, 'n': 4}
dict2 = {'n': 3, 'm': 1}

确保密钥的顺序相同:

dict2_sorted = {i:dict2[i] for i in dict1.keys()}

keys = dict1.keys()
values = zip(dict1.values(), dict2_sorted.values())
dictionary = dict(zip(keys, values))

给出:

{'m': (2, 1), 'n': (4, 3)}

1
中的元素顺序values()未定义,因此您可能正在合并不相关键中的值。
yugr

我刚刚应用了更改,现在它可以捕获您的反馈
Mahdi Ghelichi

我认为更改不会解决该问题。您需要使用sorted(d.items())sorted(d.keys())获得可预期的结果。
yugr

你能举一个例子证明它吗?dict2_sorted是python中的排序字典!
Mahdi Ghelichi

它恰好适用于您机器上的小型词典的事实并不能证明。在此处检查repro 。
yugr

3

这是您可以使用的一种方法,即使两个字典不具有相同的键,该方法也可以使用:

d1 = {'a':'test','b':'btest','d':'dreg'}
d2 = {'a':'cool','b':'main','c':'clear'}

d = {}

for key in set(d1.keys() + d2.keys()):
    try:
        d.setdefault(key,[]).append(d1[key])        
    except KeyError:
        pass

    try:
        d.setdefault(key,[]).append(d2[key])          
    except KeyError:
        pass

print d

这将生成以下输入:

{'a': ['test', 'cool'], 'c': ['clear'], 'b': ['btest', 'main'], 'd': ['dreg']}

可以set(d1.keys() + d2.keys()) 更改为set(list(d1.keys()) + list(d2.keys()))答案(对于Python 3.x)吗?否则,它会抛出一个TypeError: unsupported operand type(s) for +: 'dict_keys' and 'dict_keys'错误,在python3.x
R4444

1

Python 3.x更新

来自Eli Bendersky的答案:

Python 3删除了dict.iteritems,改用dict.items。参见Python Wiki:https : //wiki.python.org/moin/Python3.0

from collections import defaultdict

dd = defaultdict(list)

for d in (d1, d2):
    for key, value in d.items():
        dd[key].append(value)

1

即使两个字典中的键不同,此方法也会合并两个字典:

def combine_dict(d1, d2):
    combined = {}
    for k in set(d1.keys()) | set(d2.keys()):
        combined[k] = tuple(d[k] for d in [d1, d2] if k in d)
    return combined

例:

d1 = {
    'a': 1,
    'b': 2,
}
d2` = {
    'b': 'boat',
    'c': 'car',
}
combine_dict(d1, d2)
# Returns: {
#    'a': (1,),
#    'b': (2, 'boat'),
#    'c': ('car',)
# }

1

假设您具有所有键的列表(可以通过遍历所有字典并获取其键来获得此列表)。命名吧listKeys。也:

  • listValues 是要合并的单个键的所有值的列表。
  • allDicts:您要合并的所有字典。
result = {}
for k in listKeys:
    listValues = [] #we will convert it to tuple later, if you want.
    for d in allDicts:
       try:
            fileList.append(d[k]) #try to append more values to a single key
        except:
            pass
    if listValues: #if it is not empty
        result[k] = typle(listValues) #convert to tuple, add to new dictionary with key k

0
def merge(d1, d2, merge):
    result = dict(d1)
    for k,v in d2.iteritems():
        if k in result:
            result[k] = merge(result[k], v)
        else:
            result[k] = v
    return result

d1 = {'a': 1, 'b': 2}
d2 = {'a': 1, 'b': 3, 'c': 2}
print merge(d1, d2, lambda x, y:(x,y))

{'a': (1, 1), 'c': 2, 'b': (2, 3)}

0

为了补充两个列表的解决方案,这里提供了一个用于处理单个列表的解决方案。

示例列表(与NetworkX相关;在此处手动设置格式以提高可读性):

ec_num_list = [((src, tgt), ec_num['ec_num']) for src, tgt, ec_num in G.edges(data=True)]

print('\nec_num_list:\n{}'.format(ec_num_list))
ec_num_list:
[((82, 433), '1.1.1.1'),
  ((82, 433), '1.1.1.2'),
  ((22, 182), '1.1.1.27'),
  ((22, 3785), '1.2.4.1'),
  ((22, 36), '6.4.1.1'),
  ((145, 36), '1.1.1.37'),
  ((36, 154), '2.3.3.1'),
  ((36, 154), '2.3.3.8'),
  ((36, 72), '4.1.1.32'),
  ...] 

注意相同边(由元组定义)的重复值。要将这些“值”与它们相应的“键”进行比较:

from collections import defaultdict
ec_num_collection = defaultdict(list)
for k, v in ec_num_list:
    ec_num_collection[k].append(v)

print('\nec_num_collection:\n{}'.format(ec_num_collection.items()))
ec_num_collection:
[((82, 433), ['1.1.1.1', '1.1.1.2']),   ## << grouped "values"
((22, 182), ['1.1.1.27']),
((22, 3785), ['1.2.4.1']),
((22, 36), ['6.4.1.1']),
((145, 36), ['1.1.1.37']),
((36, 154), ['2.3.3.1', '2.3.3.8']),    ## << grouped "values"
((36, 72), ['4.1.1.32']),
...] 

如果需要,将该列表转换为字典:

ec_num_collection_dict = {k:v for k, v in zip(ec_num_collection, ec_num_collection)}

print('\nec_num_collection_dict:\n{}'.format(dict(ec_num_collection)))
  ec_num_collection_dict:
  {(82, 433): ['1.1.1.1', '1.1.1.2'],
  (22, 182): ['1.1.1.27'],
  (22, 3785): ['1.2.4.1'],
  (22, 36): ['6.4.1.1'],
  (145, 36): ['1.1.1.37'],
  (36, 154): ['2.3.3.1', '2.3.3.8'],
  (36, 72): ['4.1.1.32'],
  ...}

参考文献


0

从blubb答案:

您还可以使用每个列表中的值直接形成元组

ds = [d1, d2]
d = {}
for k in d1.keys():
  d[k] = (d1[k], d2[k])

如果您对元组有特定的顺序,这可能会很有用

ds = [d1, d2, d3, d4]
d = {}
for k in d1.keys():
  d[k] = (d3[k], d1[k], d4[k], d2[k]) #if you wanted tuple in order of d3, d1, d4, d2

0

这个库对我有帮助,我有一个具有相同名称但具有不同值的嵌套键的字典列表,所有其他解决方案都将覆盖这些嵌套键。

https://pypi.org/project/deepmerge/

from deepmerge import always_merger

def process_parms(args):
    temp_list = []
    for x in args:
        with open(x, 'r') as stream:
            temp_list.append(yaml.safe_load(stream))

    return always_merger.merge(*temp_list)

0

如果键嵌套:

d1 = { 'key1': { 'nkey1': 'x1' }, 'key2': { 'nkey2': 'y1' } } 
d2 = { 'key1': { 'nkey1': 'x2' }, 'key2': { 'nkey2': 'y2' } }
ds = [d1, d2]
d = {}
for k in d1.keys():
    for k2 in d1[k].keys():
        d.setdefault(k, {})
        d[k].setdefault(k2, [])
        d[k][k2] = tuple(d[k][k2] for d in ds)

产量:

{'key1': {'nkey1': ('x1', 'x2')}, 'key2': {'nkey2': ('y1', 'y2')}}

-4

可能性很小

d1={'a':1,'b':2}
d2={'c':3,'d':4}
context={**d1, **d2}
context
{'b': 2, 'c': 3, 'd': 4, 'a': 1}

问题是关于使用相同的键合并字典。您不是必需的答案。
Pbd
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.