如何检查列表中的所有元素是否存在于pandas列中?[英] How to check if all the elements in list are present in pandas column

本文是小编为大家收集整理的关于如何检查列表中的所有元素是否存在于pandas列中?的处理方法,想解了如何检查列表中的所有元素是否存在于pandas列中?的问题怎么解决?如何检查列表中的所有元素是否存在于pandas列中?问题的解决办法?那么可以参考本文帮助大家快速定位并解决问题。

问题描述

我有一个数据框和一个列表:

df = pd.DataFrame({'id':[1,2,3,4,5,6,7,8], 
    'char':[['a','b'],['a','b','c'],['a','c'],['b','c'],[],['c','a','d'],['c','d'],['a']]})

names = ['a','c']

只有当 a 和 c 都出现在 char 列中时,我才想获取行.(这里的顺序无关紧要)

预期输出:

       char  id                                                                                                                      
1  [a, b, c]   2                                                                                                                      
2     [a, c]   3                                                                                                                      
5  [c, a, d]   6   

我的努力

true_indices = []
for idx, row in df.iterrows():
    if all(name in row['char'] for name in names):
        true_indices.append(idx)


ids = df[df.index.isin(true_indices)]

这给了我正确的输出,但对于大型数据集来说太慢了,所以我正在寻找更有效的解决方案.

推荐答案

您可以遍历 df.char 中的行并保留 name 为 subset 的行:

names = set(['a','c'])
m = [name.issubset(i) for i in df.char.values.tolist()]

print(df[m])

id       char
1   2  [a, b, c]
2   3     [a, c]
5   6  [c, a, d]

本文地址:https://www.itbaoku.cn/post/1727897.html