有人可以说明依赖和零协方差如何发生吗?


12

像格雷格一样,有人可以举例说明,但更详细地讲,随机变量如何依存但协方差为零?格雷格,这里的海报,给出了使用一个圆形的例子在这里

有人可以使用一系列分阶段说明该过程的步骤来更详细地解释此过程吗?

另外,如果您从心理学中学到了一个例子,请通过相关例子说明这个概念。请在解释时非常准确和有序,并说明可能会有哪些后果。


指向您所引用文章的链接会有所帮助。
gui11aume12年

1
我很确定主题在这里:stats.stackexchange.com/questions/12842/…,格雷格(雪)的答案在这里:stats.stackexchange.com/a/12898/2073
Andy McKenzie

我最初以为解决这个问题是正确的,但是我认为也许它会问一个与stats.stackexchange.com/questions/12842 / ...稍有不同的问题,因为该线程只是询问数学示例,而该问题似乎是寻求对确切例子的理解。为什么两者不相等
Macro

Answers:


21

这里的基本思想是协方差仅度量一种特定类型的依存关系,因此两者不是等效的。特别,

  • 协方差是两个变量之间线性相关程度的度量。如果两个变量非线性相关,则这将不会反映在协方差中。在这里可以找到更详细的描述。

  • 随机变量之间的依存关系是指两者之间的任何类型的关系,这些关系会使它们“一起”采取与“自己”采取不同的行动。具体而言,随机变量之间的依存关系包括两者之间的任何关系,这些关系导致它们的联合分布不是其边际分布的乘积。这包括线性关系以及许多其他关系。

  • 如果两个变量是非线性相关的,则它们可能具有0的协方差,但仍是依存的- 此处提供许多示例,下面来自Wikipedia的图表在底行提供了一些图形示例:

    在此处输入图片说明

  • 随机变量之间的零协方差和独立性是等价条件的一个示例是变量共同呈正态分布时(即,两个变量遵循双变量正态分布,这不等同于两个变量分别呈正态分布)。另一个特殊情况是,当且仅当伯努利变量对是独立的时,它们才是不相关的(感谢@cardinal)。但是,通常不能将两者等同。

因此,通常不能仅仅因为两个变量不相关而得出结论它们是独立的(例如,没有否定不相关的无效假设)。强烈建议您绘制数据以推断两者是否相关,而不仅仅是在进行相关性测试时停止。例如,(感谢@gung),如果要进行线性回归(即测试非零相关性)并发现非重要的结果,则可能会试图得出结论,认为变量不相关,但是您会ve只研究了线性关系。

我对心理学知之甚少,但是有意义的是那里的变量之间可能存在非线性关系。作为一个玩具例子,认知能力似乎与年龄呈非线性关系-非常年轻和非常年长的人不像30岁那样敏锐。如果要对认知能力与年龄之间的关系进行某种测度,则可以预期认知能力在中等年龄时最高,然后在该年龄左右衰减,这将是一种非线性模式。


1
只是侧面说明(学究?),但是Bernoulli随机变量只有在不相关时才是独立的。:)
红衣主教

@cardinal,不用担心只是我又放弃了理性,就像当您说带有奇异协方差矩阵的多元法线“被普遍使用并且在统计上相关”时。
2012年

下次我在安阿伯(Ann Arbor)时,我会给您买杯咖啡,以弥补这一笑话。:)同时,请随时质疑我的合理性。:)
红衣主教

啊,但是最后的引用是对的。;-)它出现在一些令人惊讶的常见地方。:)(尽管这里有点偏离主题了。)
红衣主教

(+1)对于这个问题是否应该重复出现,我一直持怀疑态度。但是,我认为好的答案可以提出非常相似的问题,值得保留。使所有内容相互关联会有所帮助。
红衣主教2012年

7

教授/可视化相关性或协方差的标准方法是绘制数据,在'x'和'y'的均值处绘制线条,然后从2个均值点到各个数据点绘制矩形,如下所示:

在此处输入图片说明

右上和左下象限中的矩形(点)(在示例中为红色)为相关/协方差提供正值,而左上和右下象限中的矩形(点)(在示例中为蓝色)为负值。相关/协方差的值。如果红色矩形的总面积等于蓝色矩形的总面积,则正负相抵消,并且协方差为零。如果红色区域更大,则协方差将为正,如果蓝色区域更大,则协方差将为负。

现在,让我们看一下先前讨论中的示例:

在此处输入图片说明

各个点遵循抛物线,因此它们是相关的,如果您知道“ x”,则您确切地知道“ y”,但是您还可以看到,对于每个红色矩形,都有一个匹配的蓝色矩形,因此最终协方差将为0 。


(+1)是否有R制作这些图的程序包(我想起了一次显示这样的图的胡夫)还是您是从头开始的?
2012年

@Macro,很好的问题,尽管我认为在Mathematica中完成了胡扯。在R中使用polygonrect和支持alpha透明度的设备来“手动”执行此操作很简单。
主教

我编写了一个函数来执行此绘图,并且可能TeachingDemos会很快将其添加到程序包中。我的第一个想法是将“相关矩形”一词缩短为“正确”作为函数的名称,然后在意识到一点之后,由于做一些完全不同的事情而容易误解该名称。因此,我需要提出一个更好的名称,添加几个选项,然后将其上传到R-Forge。
格雷格·斯诺

3

一个简单的测试,如果数据基本上遵循通过均值围绕垂直轴或水平轴对称的模式,则协方差将非常接近于零。例如,如果对称性围绕y轴,则意味着对于具有给定y的每个值,与平均值x的正x差和与平均值x的负差。这些值的y * x的和为零。您可以在其他答案的示例图集合中很好地看到这一点。还有其他模式会产生零协方差,但不会产生独立性,但是通过寻找对称性或不对称性,很容易评估许多示例。


1

维基百科的一个例子:

“如果变量是独立的,则Pearson的相关系数为0,但反之则不成立,因为相关系数仅检测两个变量之间的线性相关性。例如,假设随机变量X对称地分布在零附近,并且Y = X ^ 2.然后Y完全由X决定,因此X和Y完全相关,但它们的相关性为零;它们是不相关的。但是,在特殊情况下,当X和Y共同为法线时,不相关性等效于独立性。”

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.