根据多个条件获得DF的分段[英] get subsection of df based on multiple conditions

本文是小编为大家收集整理的关于根据多个条件获得DF的分段的处理/解决方法,可以参考本文帮助大家快速定位并解决问题,中文翻译不准确的可切换到English标签页查看源文。

问题描述

我试图根据多种条件从DF提取行,必须在选择任何行之前都必须满足所有条件.

我的DF

columns = ['is_net', 'is_pct', 'is_mean', 'is_wgted', 'is_sum']
index = ['a','b','c','d']
data = [['True','True','False','False', 'False'],
       ['True','True','True','False', 'False'],
       ['True','True','False','False', 'True'],
       ['True','True','False','True', 'False']]

df = pd.DataFrame(columns=columns, index=index, data=data)
df

    is_net  is_pct  is_mean is_wgted    is_sum
a   True    True    False   False   False
b   True    True    True    False   False
c   True    True    False   False   True
d   True    True    False   True    False

我的条件必须以这种格式:

conditions = {'is_net': 'True', 
              'is_pct': 'True', 
              'is_mean': 'False', 
              'is_wgted': 'True', 
              'is_sum': 'False'}

预期输出:

    is_net  is_pct  is_mean is_wgted    is_sum
d   True    True    False   True    False

推荐答案

我认为诀窍是将conditions制成一个系列:

>>> pd.Series(conditions)
is_mean     False
is_net       True
is_pct       True
is_sum      False
is_wgted     True
dtype: object
>>> (df == pd.Series(conditions))
  is_mean is_net is_pct is_sum is_wgted
a    True   True   True   True    False
b   False   True   True   True    False
c    True   True   True  False    False
d    True   True   True   True     True
>>> (df == pd.Series(conditions)).all(axis=1)
a    False
b    False
c    False
d     True
dtype: bool
>>> df[(df == pd.Series(conditions)).all(axis=1)]
  is_net is_pct is_mean is_wgted is_sum
d   True   True   False     True  False

本文地址:https://www.itbaoku.cn/post/1727959.html

问题描述

I'm trying to extract rows from a df based on multiple conditions, ALL of the conditions must be met before any rows are selected else nothing.

My df

columns = ['is_net', 'is_pct', 'is_mean', 'is_wgted', 'is_sum']
index = ['a','b','c','d']
data = [['True','True','False','False', 'False'],
       ['True','True','True','False', 'False'],
       ['True','True','False','False', 'True'],
       ['True','True','False','True', 'False']]

df = pd.DataFrame(columns=columns, index=index, data=data)
df

    is_net  is_pct  is_mean is_wgted    is_sum
a   True    True    False   False   False
b   True    True    True    False   False
c   True    True    False   False   True
d   True    True    False   True    False

My conditions which must be in this format:

conditions = {'is_net': 'True', 
              'is_pct': 'True', 
              'is_mean': 'False', 
              'is_wgted': 'True', 
              'is_sum': 'False'}

Expected output:

    is_net  is_pct  is_mean is_wgted    is_sum
d   True    True    False   True    False

推荐答案

I think the trick is to make conditions into a Series:

>>> pd.Series(conditions)
is_mean     False
is_net       True
is_pct       True
is_sum      False
is_wgted     True
dtype: object
>>> (df == pd.Series(conditions))
  is_mean is_net is_pct is_sum is_wgted
a    True   True   True   True    False
b   False   True   True   True    False
c    True   True   True  False    False
d    True   True   True   True     True
>>> (df == pd.Series(conditions)).all(axis=1)
a    False
b    False
c    False
d     True
dtype: bool
>>> df[(df == pd.Series(conditions)).all(axis=1)]
  is_net is_pct is_mean is_wgted is_sum
d   True   True   False     True  False