我对协方差如何工作的理解是,相关数据应具有较高的协方差。我遇到了一种情况,我的数据看起来很相关(如散点图所示),但协方差接近零。如果数据的相关性是相关的,如何将它们设为零?
import numpy as np
x1 = np.array([ 0.03551153, 0.01656052, 0.03344669, 0.02551755, 0.02344788,
0.02904475, 0.03334179, 0.02683399, 0.02966126, 0.03947681,
0.02537157, 0.03015175, 0.02206443, 0.03590149, 0.03702152,
0.02697212, 0.03777607, 0.02468797, 0.03489873, 0.02167536])
x2 = np.array([ 0.0372599 , 0.02398212, 0.03649548, 0.03145494, 0.02925334,
0.03328783, 0.03638871, 0.03196318, 0.03347346, 0.03874528,
0.03098697, 0.03357531, 0.02808358, 0.03747998, 0.03804655,
0.03213286, 0.03827639, 0.02999955, 0.0371424 , 0.0279254 ])
print np.cov(x1, x2)
array([[ 3.95773132e-05, 2.59159589e-05],
[ 2.59159589e-05, 1.72006225e-05]])
4
提示:当您查看相关性时会发生什么?协方差和相关性有什么区别?
—
aleshing
如果要测量的数字看起来很小或以特定的比例接近,那么它们之间的差异也将很小,并且差异的乘积似乎会更小。尝试将所有数据乘以,然后重做计算;协方差应该是1000000倍大
—
亨利