像格雷格一样,有人可以举例说明,但更详细地讲,随机变量如何依存但协方差为零?格雷格,这里的海报,给出了使用一个圆形的例子在这里。
有人可以使用一系列分阶段说明该过程的步骤来更详细地解释此过程吗?
另外,如果您从心理学中学到了一个例子,请通过相关例子说明这个概念。请在解释时非常准确和有序,并说明可能会有哪些后果。
像格雷格一样,有人可以举例说明,但更详细地讲,随机变量如何依存但协方差为零?格雷格,这里的海报,给出了使用一个圆形的例子在这里。
有人可以使用一系列分阶段说明该过程的步骤来更详细地解释此过程吗?
另外,如果您从心理学中学到了一个例子,请通过相关例子说明这个概念。请在解释时非常准确和有序,并说明可能会有哪些后果。
Answers:
这里的基本思想是协方差仅度量一种特定类型的依存关系,因此两者不是等效的。特别,
协方差是两个变量之间线性相关程度的度量。如果两个变量非线性相关,则这将不会反映在协方差中。在这里可以找到更详细的描述。
随机变量之间的依存关系是指两者之间的任何类型的关系,这些关系会使它们“一起”采取与“自己”采取不同的行动。具体而言,随机变量之间的依存关系包括两者之间的任何关系,这些关系导致它们的联合分布不是其边际分布的乘积。这包括线性关系以及许多其他关系。
如果两个变量是非线性相关的,则它们可能具有0的协方差,但仍是依存的- 此处提供了许多示例,下面来自Wikipedia的图表在底行提供了一些图形示例:
随机变量之间的零协方差和独立性是等价条件的一个示例是变量共同呈正态分布时(即,两个变量遵循双变量正态分布,这不等同于两个变量分别呈正态分布)。另一个特殊情况是,当且仅当伯努利变量对是独立的时,它们才是不相关的(感谢@cardinal)。但是,通常不能将两者等同。
因此,通常不能仅仅因为两个变量不相关而得出结论它们是独立的(例如,没有否定不相关的无效假设)。强烈建议您绘制数据以推断两者是否相关,而不仅仅是在进行相关性测试时停止。例如,(感谢@gung),如果要进行线性回归(即测试非零相关性)并发现非重要的结果,则可能会试图得出结论,认为变量不相关,但是您会ve只研究了线性关系。
我对心理学知之甚少,但是有意义的是那里的变量之间可能存在非线性关系。作为一个玩具例子,认知能力似乎与年龄呈非线性关系-非常年轻和非常年长的人不像30岁那样敏锐。如果要对认知能力与年龄之间的关系进行某种测度,则可以预期认知能力在中等年龄时最高,然后在该年龄左右衰减,这将是一种非线性模式。
教授/可视化相关性或协方差的标准方法是绘制数据,在'x'和'y'的均值处绘制线条,然后从2个均值点到各个数据点绘制矩形,如下所示:
右上和左下象限中的矩形(点)(在示例中为红色)为相关/协方差提供正值,而左上和右下象限中的矩形(点)(在示例中为蓝色)为负值。相关/协方差的值。如果红色矩形的总面积等于蓝色矩形的总面积,则正负相抵消,并且协方差为零。如果红色区域更大,则协方差将为正,如果蓝色区域更大,则协方差将为负。
现在,让我们看一下先前讨论中的示例:
各个点遵循抛物线,因此它们是相关的,如果您知道“ x”,则您确切地知道“ y”,但是您还可以看到,对于每个红色矩形,都有一个匹配的蓝色矩形,因此最终协方差将为0 。
R
制作这些图的程序包(我想起了一次显示这样的图的胡夫)还是您是从头开始的?
polygon
或rect
和支持alpha透明度的设备来“手动”执行此操作很简单。
TeachingDemos
会很快将其添加到程序包中。我的第一个想法是将“相关矩形”一词缩短为“正确”作为函数的名称,然后在意识到一点之后,由于做一些完全不同的事情而容易误解该名称。因此,我需要提出一个更好的名称,添加几个选项,然后将其上传到R-Forge。
维基百科的一个例子:
“如果变量是独立的,则Pearson的相关系数为0,但反之则不成立,因为相关系数仅检测两个变量之间的线性相关性。例如,假设随机变量X对称地分布在零附近,并且Y = X ^ 2.然后Y完全由X决定,因此X和Y完全相关,但它们的相关性为零;它们是不相关的。但是,在特殊情况下,当X和Y共同为法线时,不相关性等效于独立性。”