Pandas根据多个条件过滤行[英] Pandas filter rows based on multiple conditions

本文是小编为大家收集整理的关于Pandas根据多个条件过滤行的处理方法,想解了Pandas根据多个条件过滤行的问题怎么解决?Pandas根据多个条件过滤行问题的解决办法?那么可以参考本文帮助大家快速定位并解决问题。

问题描述

i在risk列中有一些值,Small,Medium或High既不是.我想以不为Small,Medium和High的值删除行.我尝试了以下内容:

df = df[(df.risk == "Small") | (df.risk == "Medium") | (df.risk == "High")]

但这返回一个空数据框.如何正确过滤它们?

推荐答案

我认为您想要:

df = df[(df.risk.isin(["Small","Medium","High"]))]

示例:

In [5]:
import pandas as pd
df = pd.DataFrame({'risk':['Small','High','Medium','Negligible', 'Very High']})
df

Out[5]:

         risk
0       Small
1        High
2      Medium
3  Negligible
4   Very High

[5 rows x 1 columns]

In [6]:

df[df.risk.isin(['Small','Medium','High'])]

Out[6]:

     risk
0   Small
1    High
2  Medium

[3 rows x 1 columns]

其他推荐答案

另一种不错的可读方法是:

small_risk = df["risk"] == "Small"
medium_risk = df["risk"] == "Medium"
high_risk = df["risk"] == "High"

然后您可以这样使用:

df[small_risk | medium_risk | high_risk]

df[small_risk & medium_risk]

其他推荐答案

您还可以使用变量.例如:

lst = ["Small","Medium","High"]
df.query("risk in @lst")

如果列名是多个单词,例如"risk factor",您可以通过Backticks ` `来引用它:

df.query('`risk factor` in @lst')

query如果您需要链接多个条件,方法会派上用场.例如,以下过滤器的结果:

df[df['risk factor'].isin(lst) & (df['value']**2 > 2) & (df['value']**2 < 5)]

可以使用以下表达式得出:

df.query('`risk factor` in @lst and 2 < value**2 < 5')

本文地址:https://www.itbaoku.cn/post/1727922.html