获取字典中具有最大值的键?


866

我有一个dictionary:键是字符串,值是整数。

例:

stats = {'a':1000, 'b':3000, 'c': 100}

我想得到'b'一个答案,因为它是具有更高价值的关键。

我使用带有反向键值元组的中间列表进行了以下操作:

inverse = [(value, key) for key, value in stats.items()]
print max(inverse)[1]

那是更好(或更优雅)的方法吗?


1
嗯,怎么了max(stats)
约翰·雷德

12
max(stats)将使用标签作为键('c'鉴于最大标签,max(stats, key=lambda key: stats[key])它将返回'b',这将返回OP所执行的操作(它将返回最大索引值的标签)。更清楚了吗?
Atcold

Answers:


609

您可以使用operator.itemgetter

import operator
stats = {'a':1000, 'b':3000, 'c': 100}
max(stats.iteritems(), key=operator.itemgetter(1))[0]

而不是在内存使用中构建新列表stats.iteritems()。该函数的key参数max()是一个函数,该函数计算用于确定如何对项目进行排名的键。

请注意,如果要使用另一个键值对“ d”:3000,则此方法将仅返回两个值中的一个,即使它们都具有最大值。

>>> import operator
>>> stats = {'a':1000, 'b':3000, 'c': 100, 'd':3000}
>>> max(stats.iteritems(), key=operator.itemgetter(1))[0]
'b' 

如果使用Python3:

>>> max(stats.items(), key=operator.itemgetter(1))[0]
'b'

241
我认为甚至更清洁max(stats.iterkeys(), key=(lambda key: stats[key]))
Lucretiel

18
为什么不只是使用key=lambda x: x[1]
BenDundee 2014年

43
在python 3 @Lucretiel的(正确拼写)解决方案中失败。它应该是:max(stats.keys(),key =(lambda k:stats [k])),因为keys()现在会执行iterkeys()自动执行的操作。
沃顿尼克

73
刚好 有趣的是,一种与内存效率完全相同并且可以在Python 2和3中使用的解决方案是:max(stats, key=lambda key: stats[key])
Lucretiel

3
老实说,我认为这些评论具有更清洁,更好的解决方案。
奥古斯托·冈萨雷斯

1177
max(stats, key=stats.get)

17
如果您真的想这样做,可以这样做stats[max(stats, key=stats.get)]
CrackSmoker9000

81
@ scottmrogowski,ss。根据要求,它提供具有最大值的密钥。最大值将仅仅是max(stats.values())。
A. Coady

25
这应该是答案,因为它是最简单的,而且正是OP所要求的。
ihatecache

4
@Coady如果两个键(具有相同的值)之间有关系怎么办?我想两者都拿,但我只能拿一个。
oba2311'4

10
@ oba2311max_value = max(stats.values()); {key for key, value in stats.items() if value == max_value}
A. Coady

208

我已经测试了许多变体,这是用最大值返回字典键的最快方法:

def keywithmaxval(d):
     """ a) create a list of the dict's keys and values; 
         b) return the key with the max value"""  
     v=list(d.values())
     k=list(d.keys())
     return k[v.index(max(v))]

为了给您一个想法,以下是一些候选方法:

def f1():  
     v=list(d1.values())
     k=list(d1.keys())
     return k[v.index(max(v))]

def f2():
    d3={v:k for k,v in d1.items()}
    return d3[max(d3)]

def f3():
    return list(filter(lambda t: t[1]==max(d1.values()), d1.items()))[0][0]    

def f3b():
    # same as f3 but remove the call to max from the lambda
    m=max(d1.values())
    return list(filter(lambda t: t[1]==m, d1.items()))[0][0]        

def f4():
    return [k for k,v in d1.items() if v==max(d1.values())][0]    

def f4b():
    # same as f4 but remove the max from the comprehension
    m=max(d1.values())
    return [k for k,v in d1.items() if v==m][0]        

def f5():
    return max(d1.items(), key=operator.itemgetter(1))[0]    

def f6():
    return max(d1,key=d1.get)     

def f7():
     """ a) create a list of the dict's keys and values; 
         b) return the key with the max value"""    
     v=list(d1.values())
     return list(d1.keys())[v.index(max(v))]    

def f8():
     return max(d1, key=lambda k: d1[k])     

tl=[f1,f2, f3b, f4b, f5, f6, f7, f8, f4,f3]     
cmpthese.cmpthese(tl,c=100) 

测试字典:

d1={1: 1, 2: 2, 3: 8, 4: 3, 5: 6, 6: 9, 7: 17, 8: 4, 9: 20, 10: 7, 11: 15, 
    12: 10, 13: 10, 14: 18, 15: 18, 16: 5, 17: 13, 18: 21, 19: 21, 20: 8, 
    21: 8, 22: 16, 23: 16, 24: 11, 25: 24, 26: 11, 27: 112, 28: 19, 29: 19, 
    30: 19, 3077: 36, 32: 6, 33: 27, 34: 14, 35: 14, 36: 22, 4102: 39, 38: 22, 
    39: 35, 40: 9, 41: 110, 42: 9, 43: 30, 44: 17, 45: 17, 46: 17, 47: 105, 48: 12, 
    49: 25, 50: 25, 51: 25, 52: 12, 53: 12, 54: 113, 1079: 50, 56: 20, 57: 33, 
    58: 20, 59: 33, 60: 20, 61: 20, 62: 108, 63: 108, 64: 7, 65: 28, 66: 28, 67: 28, 
    68: 15, 69: 15, 70: 15, 71: 103, 72: 23, 73: 116, 74: 23, 75: 15, 76: 23, 77: 23, 
    78: 36, 79: 36, 80: 10, 81: 23, 82: 111, 83: 111, 84: 10, 85: 10, 86: 31, 87: 31, 
    88: 18, 89: 31, 90: 18, 91: 93, 92: 18, 93: 18, 94: 106, 95: 106, 96: 13, 9232: 35, 
    98: 26, 99: 26, 100: 26, 101: 26, 103: 88, 104: 13, 106: 13, 107: 101, 1132: 63, 
    2158: 51, 112: 21, 113: 13, 116: 21, 118: 34, 119: 34, 7288: 45, 121: 96, 122: 21, 
    124: 109, 125: 109, 128: 8, 1154: 32, 131: 29, 134: 29, 136: 16, 137: 91, 140: 16, 
    142: 104, 143: 104, 146: 117, 148: 24, 149: 24, 152: 24, 154: 24, 155: 86, 160: 11, 
    161: 99, 1186: 76, 3238: 49, 167: 68, 170: 11, 172: 32, 175: 81, 178: 32, 179: 32, 
    182: 94, 184: 19, 31: 107, 188: 107, 190: 107, 196: 27, 197: 27, 202: 27, 206: 89, 
    208: 14, 214: 102, 215: 102, 220: 115, 37: 22, 224: 22, 226: 14, 232: 22, 233: 84, 
    238: 35, 242: 97, 244: 22, 250: 110, 251: 66, 1276: 58, 256: 9, 2308: 33, 262: 30, 
    263: 79, 268: 30, 269: 30, 274: 92, 1300: 27, 280: 17, 283: 61, 286: 105, 292: 118, 
    296: 25, 298: 25, 304: 25, 310: 87, 1336: 71, 319: 56, 322: 100, 323: 100, 325: 25, 
    55: 113, 334: 69, 340: 12, 1367: 40, 350: 82, 358: 33, 364: 95, 376: 108, 
    377: 64, 2429: 46, 394: 28, 395: 77, 404: 28, 412: 90, 1438: 53, 425: 59, 430: 103, 
    1456: 97, 433: 28, 445: 72, 448: 23, 466: 85, 479: 54, 484: 98, 485: 98, 488: 23, 
    6154: 37, 502: 67, 4616: 34, 526: 80, 538: 31, 566: 62, 3644: 44, 577: 31, 97: 119, 
    592: 26, 593: 75, 1619: 48, 638: 57, 646: 101, 650: 26, 110: 114, 668: 70, 2734: 41, 
    700: 83, 1732: 30, 719: 52, 728: 96, 754: 65, 1780: 74, 4858: 47, 130: 29, 790: 78, 
    1822: 43, 2051: 38, 808: 29, 850: 60, 866: 29, 890: 73, 911: 42, 958: 55, 970: 99, 
    976: 24, 166: 112}

以及在Python 3.2下的测试结果:

    rate/sec       f4      f3    f3b     f8     f5     f2    f4b     f6     f7     f1
f4       454       --   -2.5% -96.9% -97.5% -98.6% -98.6% -98.7% -98.7% -98.9% -99.0%
f3       466     2.6%      -- -96.8% -97.4% -98.6% -98.6% -98.6% -98.7% -98.9% -99.0%
f3b   14,715  3138.9% 3057.4%     -- -18.6% -55.5% -56.0% -56.4% -58.3% -63.8% -68.4%
f8    18,070  3877.3% 3777.3%  22.8%     -- -45.4% -45.9% -46.5% -48.8% -55.5% -61.2%
f5    33,091  7183.7% 7000.5% 124.9%  83.1%     --  -1.0%  -2.0%  -6.3% -18.6% -29.0%
f2    33,423  7256.8% 7071.8% 127.1%  85.0%   1.0%     --  -1.0%  -5.3% -17.7% -28.3%
f4b   33,762  7331.4% 7144.6% 129.4%  86.8%   2.0%   1.0%     --  -4.4% -16.9% -27.5%
f6    35,300  7669.8% 7474.4% 139.9%  95.4%   6.7%   5.6%   4.6%     -- -13.1% -24.2%
f7    40,631  8843.2% 8618.3% 176.1% 124.9%  22.8%  21.6%  20.3%  15.1%     -- -12.8%
f1    46,598 10156.7% 9898.8% 216.7% 157.9%  40.8%  39.4%  38.0%  32.0%  14.7%     --

在Python 2.7下:

    rate/sec       f3       f4     f8    f3b     f6     f5     f2    f4b     f7     f1
f3       384       --    -2.6% -97.1% -97.2% -97.9% -97.9% -98.0% -98.2% -98.5% -99.2%
f4       394     2.6%       -- -97.0% -97.2% -97.8% -97.9% -98.0% -98.1% -98.5% -99.1%
f8    13,079  3303.3%  3216.1%     --  -5.6% -28.6% -29.9% -32.8% -38.3% -49.7% -71.2%
f3b   13,852  3504.5%  3412.1%   5.9%     -- -24.4% -25.8% -28.9% -34.6% -46.7% -69.5%
f6    18,325  4668.4%  4546.2%  40.1%  32.3%     --  -1.8%  -5.9% -13.5% -29.5% -59.6%
f5    18,664  4756.5%  4632.0%  42.7%  34.7%   1.8%     --  -4.1% -11.9% -28.2% -58.8%
f2    19,470  4966.4%  4836.5%  48.9%  40.6%   6.2%   4.3%     --  -8.1% -25.1% -57.1%
f4b   21,187  5413.0%  5271.7%  62.0%  52.9%  15.6%  13.5%   8.8%     -- -18.5% -53.3%
f7    26,002  6665.8%  6492.4%  98.8%  87.7%  41.9%  39.3%  33.5%  22.7%     -- -42.7%
f1    45,354 11701.5% 11399.0% 246.8% 227.4% 147.5% 143.0% 132.9% 114.1%  74.4%     -- 

您可以看到f1在Python 3.2和2.7下这是最快的(或者更完整地说,keywithmaxval在本文的顶部)


12
这似乎很腥。f7就像f1,只是不给中间对象起名字。f7应该是(非常轻微)的速度比f1,没有太大慢。那就是我得到的:>>> timeit.timeit("f1()","from __main__ import f1, f7, d1", number=10000) 0.26785888786807277 >>> timeit.timeit("f7()","from __main__ import f1, f7, d1", number=10000) 0.26770628307832567
恢复莫妮卡

1
同意f1就像f7。用ipython%timeit进行了测试,并且在我的机器上使用python 2.7时都具有相同的性能。测试:每回路f1-18 µs测试:每回路f2-33.7 µs测试:f3b-每回路50 µs测试:f4b-每回路30.7 µs测试:f5-每回路28 µs测试:f6-每回路23 µs测试: f7-每个循环18 µs测试:f8-每个循环43.9 µs测试:f4-每个循环2.16 ms测试:f3-每个循环2.29 ms
Joop

当max(d,key)不可用时,f1也适用。
Nikos Alexandris

5
我以为dict是未排序的,理论上d.keys和d.values的顺序是否可以不同?
Dimath'1

1
清单副本解决方案对我来说很臭。包含成千上万个条目的字典的性能如何?
Lucretiel

63

如果你只需要知道与最高值的键,你可以不用iterkeys或者iteritems因为迭代通过Python字典是迭代通过它的键。

max_key = max(stats, key=lambda k: stats[k])

编辑:

从评论@ user1274878:

我是python的新手。您能分步解释您的答案吗?

是的

最高

max(iterable [,key])

max(arg1,arg2,* args [,key])

返回可迭代的最大项或两个或多个参数中的最大项。

可选key参数描述如何比较元素以获得最大的元素:

lambda <item>: return <a result of operation with item> 

返回的值将被比较。

辞典

Python dict是一个哈希表。dict的键是声明为键的对象的哈希。由于性能原因,尽管通过字典的键实现了迭代,但仍执行迭代。

因此,我们可以使用它来摆脱获取密钥列表的操作。

关闭

在另一个函数内部定义的函数称为嵌套函数。嵌套函数可以访问封闭范围的变量。

stats通过函数的__closure__属性可用的变量,lambda作为指向父范围中定义的变量值的指针。


1
@ I159:我是python的新手。能否请你解释你的答案的步骤
user1274878

57

例:

stats = {'a':1000, 'b':3000, 'c': 100}

如果您想通过键找到最大值,则跟随可能很简单,而无需任何相关功能。

max(stats, key=stats.get)

输出是具有最大值的键。


这种解决方案比最大测试更快(统计资料,键=拉姆达键:统计[键])
Ta946

46

这是另一个:

stats = {'a':1000, 'b':3000, 'c': 100}
max(stats.iterkeys(), key=lambda k: stats[k])

该函数key仅返回应用于排序的值,并立即max()返回所需的元素。


10
.iterkeys不需要在您的答案中(这是迭代dict时的默认设置)。但是,请注意,.iteritems方法只需一步就可以获取键和值,因此不需要像.iterkeys那样每个键都需要额外的getitem。
tzot

这是一个很好的答案,因为很清楚发生了什么,因此很容易扩展到其他情况。
Leopd

在python3版本中:max(stats, key=lambda k: stats[k])
HeyJude

40
key, value = max(stats.iteritems(), key=lambda x:x[1])

如果您不在乎价值(我会很惊讶,但是),您可以这样做:

key, _ = max(stats.iteritems(), key=lambda x:x[1])

与表达式末尾的[0]下标相比,我更喜欢将元组拆包。我从不非常喜欢lambda表达式的可读性,但是发现它比operator.itemgetter(1)更好。


9
_可以代替ignored
jfs

1
@JFSebastian我同意ignored看起来很丑,但是_出于某些原因,有些人反对使用。我认为即使忽略该值,第一个代码片段也很好
jamylak 2013年

30

鉴于有多个条目,我拥有最大值。我将列出具有最大值的键。

>>> stats = {'a':1000, 'b':3000, 'c': 100, 'd':3000}
>>> [key for m in [max(stats.values())] for key,val in stats.iteritems() if val == m]
['b', 'd']

这也将为您提供“ b”和任何其他最大键。

注意:对于python 3,请使用stats.items()代替stats.iteritems()


9
您的解决方案还可以,但是计算最大值的次数是dict中包含项目的次数。如果计算max很昂贵(例如,长字典),我建议[key for m in [max(stats.values())] for key,val in stats.iteritems() if val == m]您使用单行代码,否则请m = ...事先进行计算。
gboffi 2014年

4
简短说明:对于python 3,请使用stats.items()而不是stats.iteritems()。
苏萨

21

您可以使用:

max(d, key = d.get) 
# which is equivalent to 
max(d, key = lambda k : d.get(k))

要返回键,值对使用:

max(d.items(), key = lambda k : k[1])

7
这应该是公认的答案,比使用运算符要简单得多
Sigmatics

19

要获得字典的最大键/值stats

stats = {'a':1000, 'b':3000, 'c': 100}
  • 基于

>>> max(stats.items(), key = lambda x: x[0]) ('c', 100)

  • 基于价值

>>> max(stats.items(), key = lambda x: x[1]) ('b', 3000)

当然,如果只想从结果中获取键或值,则可以使用元组索引。例如,要获取对应于最大值的密钥:

>>> max(stats.items(), key = lambda x: x[1])[0] 'b'

说明

items()Python 3中的dictionary方法返回字典的view对象。通过该max函数迭代该视图对象时,它会将字典项生成为form的元组(key, value)

>>> list(stats.items()) [('c', 100), ('b', 3000), ('a', 1000)]

使用lambda表达式时lambda x: x[1],在每次迭代中,x 都是这些元组之一(key, value)。因此,通过选择正确的索引,您可以选择是按键还是按值进行比较。

Python 2

对于Python 2.2+版本,相同的代码将起作用。但是,最好使用iteritems()字典方法而不是items()性能。

笔记


14
d = {'A': 4,'B':10}

min_v = min(zip(d.values(), d.keys()))
# min_v is (4,'A')

max_v = max(zip(d.values(), d.keys()))
# max_v is (10,'B')

10

通过在选定答案中的注释进行迭代的解决方案...

在Python 3中:

max(stats.keys(), key=(lambda k: stats[k]))

在Python 2中:

max(stats.iterkeys(), key=(lambda k: stats[k]))

您的Python 3解决方案也适用于Python 2.7。
patapouf_ai 2015年

4
因为keys()不会在python 2中返回迭代器,因此会导致性能
下降

10

我到达这里是mydict.keys()根据的值寻找如何返回mydict.values()。我不只是返回一个键,而是希望返回前x个值。

该解决方案比使用该max()函数更简单,并且您可以轻松更改返回的值数量:

stats = {'a':1000, 'b':3000, 'c': 100}

x = sorted(stats, key=(lambda key:stats[key]), reverse=True)
['b', 'a', 'c']

如果要使用单个最高排名的键,只需使用索引:

x[0]
['b']

如果要使用排名最高的前两个键,请使用列表切片:

x[:2]
['b', 'a']

这是一个非常低效的解决方案。对dict进行排序将导致运行时间为n log(n),因为您担心的是一堆不是最大的值。使用max函数将导致运行时间仅为n,这要快得多。
彼得·格雷厄姆

1
@PeterGraham几乎这里的每个解决方案(包括接受的答案)都使用max()。很明显这是最快的。我以为我会提供切片的好处,这在当时对我更有用
donrondadon

8

我对这些答案都不满意。max总是选择具有最大值的第一个键。字典可以有多个具有该值的键。

def keys_with_top_values(my_dict):
    return [key  for (key, value) in my_dict.items() if value == max(my_dict.values())]

发布此答案,以防有人帮忙。见下面的SO帖子

如果是平局,Python会选择哪个最大值?


7

collections.Counter你可以做

>>> import collections
>>> stats = {'a':1000, 'b':3000, 'c': 100}
>>> stats = collections.Counter(stats)
>>> stats.most_common(1)
[('b', 3000)]

如果合适,您可以简单地以空开头collections.Counter并添加到其中

>>> stats = collections.Counter()
>>> stats['a'] += 1
:
etc. 

5

堆队列是一种通用解决方案,它允许您提取按值排序的前n个键:

from heapq import nlargest

stats = {'a':1000, 'b':3000, 'c': 100}

res1 = nlargest(1, stats, key=stats.__getitem__)  # ['b']
res2 = nlargest(2, stats, key=stats.__getitem__)  # ['b', 'a']

res1_val = next(iter(res1))                       # 'b'

注意dict.__getitem__是语法糖调用的方法dict[]。与相对dict.getKeyError如果未找到密钥,它将返回,在此不会发生。


4

max((value, key) for key, value in stats.items())[1]


1
这将按具有重复最大值的键排序。这可能是希望的,也可能不是。
罗伯·罗斯

2

+1 @Aric Coady的最简单的解决方案。
还有一种在字典中随机选择具有最大值的键之一的方法:

stats = {'a':1000, 'b':3000, 'c': 100, 'd':3000}

import random
maxV = max(stats.values())
# Choice is one of the keys with max value
choice = random.choice([key for key, value in stats.items() if value == maxV])


1

怎么样:

 max(zip(stats.keys(), stats.values()), key=lambda t : t[1])[0]

3
zip(stats.keys(), stats.values())是更长的写作方式stats.items()。做出更改后,您的答案将与几个较旧的答案几乎相同。
vaultah

同意,我当时不知道items()与zip相同
user2399453 2009年

items与相同zip。它只是产生相同的结果。
保罗·鲁尼

0

我在一个非常基本的循环中测试了可接受的答案和@thewolf最快的解决方案,该循环比两者都快:

import time
import operator


d = {"a"+str(i): i for i in range(1000000)}

def t1(dct):
    mx = float("-inf")
    key = None
    for k,v in dct.items():
        if v > mx:
            mx = v
            key = k
    return key

def t2(dct):
    v=list(dct.values())
    k=list(dct.keys())
    return k[v.index(max(v))]

def t3(dct):
    return max(dct.items(),key=operator.itemgetter(1))[0]

start = time.time()
for i in range(25):
    m = t1(d)
end = time.time()
print ("Iterating: "+str(end-start))

start = time.time()
for i in range(25):
    m = t2(d)
end = time.time()
print ("List creating: "+str(end-start))

start = time.time()
for i in range(25):
    m = t3(d)
end = time.time()
print ("Accepted answer: "+str(end-start))

结果:

Iterating: 3.8201940059661865
List creating: 6.928712844848633
Accepted answer: 5.464320182800293

0

对于科学的python用户,以下是使用Pandas的简单解决方案:

import pandas as pd
stats = {'a': 1000, 'b': 3000, 'c': 100}
series = pd.Series(stats)
series.idxmax()

>>> b

0

如果您有多个具有相同值的键,例如:

stats = {'a':1000, 'b':3000, 'c': 100, 'd':3000, 'e':3000}

您可以获得具有最大值的所有键的集合,如下所示:

from collections import defaultdict
from collections import OrderedDict

groupedByValue = defaultdict(list)
for key, value in sorted(stats.items()):
    groupedByValue[value].append(key)

# {1000: ['a'], 3000: ['b', 'd', 'e'], 100: ['c']}

groupedByValue[max(groupedByValue)]
# ['b', 'd', 'e']

0

更简单易懂的方法:

dict = { 'a':302, 'e':53, 'g':302, 'h':100 }
max_value_keys = [key for key in dict.keys() if dict[key] == max(dict.values())]
print(max_value_keys) # prints a list of keys with max value

输出: ['a','g']

现在您只能选择一个键:

maximum = dict[max_value_keys[0]]
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.