我有一个这样的数据框:
cluster org time
1 a 8
1 a 6
2 h 34
1 c 23
2 d 74
3 w 6
我想计算每个集群每个组织的平均时间。
预期结果:
cluster mean(time)
1 15 ((8+6)/2+23)/2
2 54 (74+34)/2
3 6
我不知道如何在熊猫中做到这一点,有人可以帮忙吗?
df.groupby(['org','cluster']).mean()
吗?相对于此,这对您的数据集而言意义不大:df.groupby(['cluster','org']).mean()