Answers:
df.index.get_level_values(0).isin
了多指标
对于大型数据集,通过skiprows
参数仅读取选定的行会节省内存。
例
pred = lambda x: x not in [1, 3]
pd.read_csv("data.csv", skiprows=pred, index_col=0, names=...)
现在,这将从文件中返回一个DataFrame,该文件将跳过除1和3之外的所有行。
细节
从文档:
skiprows
:类似于列表或整数或可调用的列表,默认None
...
如果可调用,则将针对行索引评估可调用函数,如果应跳过该行,则返回True,否则返回False。有效的可调用参数的一个示例是
lambda x: x in [0, 2]