我有一个带有多个条目的熊猫数据框,并且我想计算某种类型商店的收入之间的相关性。许多商店都有收入数据,活动区域分类(剧院,布料商店,食品...)和其他数据。
我尝试创建一个新的数据框,并插入一列,其中包含属于同一类别的所有种类的商店的收入,返回的数据框仅填充了第一列,其余填充了NaN。我累的代码:
corr = pd.DataFrame()
for at in activity:
stores.loc[stores['Activity']==at]['income']
我想这样做,所以我可以.corr()
用来给出商店类别之间的相关矩阵。
之后,我想知道如何使用matplolib绘制矩阵值(-1到1,因为我想使用Pearson的相关性)。
stanford.edu/~mwaskom/软件
—
seaborn /