据我了解,我们可以通过使用等式对协方差进行归一化来获得相关性
其中是的标准偏差。 X我
我担心的是标准偏差等于零怎么办?是否有任何条件可以保证它不能为零?
谢谢。
据我了解,我们可以通过使用等式对协方差进行归一化来获得相关性
其中是的标准偏差。 X我
我担心的是标准偏差等于零怎么办?是否有任何条件可以保证它不能为零?
谢谢。
Answers:
的确,如果您的SD之一为0,则该方程式是不确定的。但是,考虑这种情况的更好方法是,如果SD之一为0,则没有相关性。用松散的概念术语,相关性告诉您一个变量如何移动,而另一个变量如何移动。SD为0表示变量未在“四处移动”。您将必须有一个常数向量,例如rep(constant, n_times)
。
另一件事要考虑的是当我们讨论均值和标准差以及相关性时的基本假设。
如果我们谈论的是数据样本,一个普遍的假设是数据(至少近似地)是正态分布的,或者可以被转换为正态分布(例如,通过对数变换)。如果您观察到标准偏差为零,则有两种情况:标准偏差实际上不是零,但是非常小,因此您的数据集中的样本均在平均值上(例如,这种情况可能会发生如果您以粗略的精度测量数据);或模型指定不正确。
在第二种情况下,标准偏差以及相关性是无意义的度量。
更一般而言,基础分布必须都具有有限的第二矩,因此也必须具有非零标准偏差,以使相关成为有效的概念。
免责声明,我意识到已经有了一个可以接受的优质答案,因此这应该是一个答复,但是我没有经验值允许这样做。@Dilip提到可以将约定的相关性定义为0,但这似乎有问题,因为与真正为零的相关性(SD为非零)的解释有很大不同。最初的问题是“如果一个变量的SD为零”。如果我们只是停下来想一想“变量”的定义,那么我们将获得一条更直接的答案之路。SD为0的变量根本不是变量,而是常量。因此,在这种情况下,您没有两个变量,因此从概念上讲根本没有定义关联的意义。