如何从Python-3的DataFrame中查找前N个最小值


9

我在数据框下方有字段“年龄”,需要从数据框中找到前3个最低年龄

DF = pd.DataFrame.from_dict({'Name':['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'], 'Age':[18, 45, 35, 70, 23, 24, 50, 65, 18, 23]})

DF['Age'].min()  

要在列表中排名前两个年龄(即18、23),如何实现?

注意:DataFrame-DF包含年龄重复项,即18和23重复两次,需要唯一值。

Answers:


14

您可以使用nsmallest(..)[pandas-doc]

df.nsmallest(2, 'Age')

对于给定的样本数据,这给我们:

>>> df.nsmallest(2, 'Age')
  Name  Age
0    A   18
4    E   23

或者,如果您只需要Age列的值:

>>> df['Age'].nsmallest(2)
0    18
4    23
Name: Age, dtype: int64

或者您可以将其包装在列表中:

>>> df['Age'].nsmallest(2).to_list()
[18, 23]

您可以获取ñ最小的独特价值,首先构造一个Series具有唯一值:

>>> pd.Series(df['Age'].unique()).nsmallest(2)
0    18
4    23
dtype: int64
>>> df['Age'].drop_duplicates().nsmallest(2)
0    18
4    23
Name: Age, dtype: int64

2
@SPy:您也可以使用df['Age'].nsmallest(2)它:)
Willem Van Onsem '19

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.