潘达斯数据框架计算重复的行并填充列[英] Pandas DataFrame count duplicate rows and fill in column

本文是小编为大家收集整理的关于潘达斯数据框架计算重复的行并填充列的处理方法,想解了潘达斯数据框架计算重复的行并填充列的问题怎么解决?潘达斯数据框架计算重复的行并填充列问题的解决办法?那么可以参考本文帮助大家快速定位并解决问题。

问题描述

我已经创建了一个数据框,现在需要计算每个重复行(例如df ['性别'].假设性别'男性'出现两次,三次出现,我需要制作此列:

Gender   Occurrence
Male     1
Male     2
Female   1
Female   2
Female   3

有没有办法用熊猫来做到这一点?

推荐答案

使用pandas.pydata.org/pandas-docs/stable/generated/generated/pandas.groupby.groupby.groupby.cumcount.html" 通过Gender分组后的方法:

df = pd.DataFrame({'Gender':['Male','Male','Female','Female','Female']})   
df['Occurrence'] = df.groupby('Gender').cumcount() + 1
print(df)

   Gender  Occurrence
0    Male           1
1    Male           2
2  Female           1
3  Female           2
4  Female           3

计数从0开始,所以我在那里添加了+ 1.

本文地址:https://www.itbaoku.cn/post/1728152.html