关于是否应在进行对数转换之前或之后为两个随机变量X和Y计算出皮尔逊相关性,是否有一个普遍的原则?有测试哪个程序更合适?它们产生相似但不同的值,因为对数变换是非线性的。是否取决于对数后X或Y是否更接近常态?如果是这样,那为什么重要呢?这是否意味着应该对X和Y与log(X)和log(Y)进行正态性检验,并据此确定pearson(x,y)是否比pearson(log(x),log( y))?
@vinux有一个很好的答案,并提供了一个有用的链接来理解正态性在相关性中的作用。我只想指出这个问题:stats.stackexchange.com/questions/298,这对于了解日志在回归中的作用非常有用。
—
gung-恢复莫妮卡