根据“未进入”条件从数据框中删除行[重复]


97

当日期列的值在日期列表中时,我想从熊猫数据框中删除行。以下代码不起作用:

a=['2015-01-01' , '2015-02-01']

df=df[df.datecolumn not in a]

我收到以下错误:

ValueError:系列的真值不明确。使用a.empty,a.bool(),a.item(),a.any()或a.all()。

Answers:


180

您可以使用pandas.Dataframe.isin

pandas.Dateframe.isin将返回布尔值,具体取决于每个元素是否在列表内a。然后,您~可以将转换TrueFalse,反之亦然。

import pandas as pd

a = ['2015-01-01' , '2015-02-01']

df = pd.DataFrame(data={'date':['2015-01-01' , '2015-02-01', '2015-03-01' , '2015-04-01', '2015-05-01' , '2015-06-01']})

print(df)
#         date
#0  2015-01-01
#1  2015-02-01
#2  2015-03-01
#3  2015-04-01
#4  2015-05-01
#5  2015-06-01

df = df[~df['date'].isin(a)]

print(df)
#         date
#2  2015-03-01
#3  2015-04-01
#4  2015-05-01
#5  2015-06-01

7
您可能Series.isin不是这样DataFrame.isin。您要比较的是一列,而不是整个df。
Acumenus

33

您可以使用Series.isin

df = df[~df.datecolumn.isin(a)]

虽然错误消息提示您可以使用all()any(),但仅当您要将结果简化为单个布尔值时,它们才有用。但是,这不是您现在要尝试的操作,而是要针对外部列表测试Series中每个值的成员资格,并保持结果不变(即布尔系列,该布尔系列随后将用于切片原始DataFrame) )。

您可以在Gotchas中阅读有关此内容的更多信息。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.