普通语言的协方差是什么?


Answers:


82

协方差是一个变量的变化与第二个变量的变化如何关联的度量。具体而言,协方差度量两个变量线性关联的程度。但是,它也经常非正式地用作两个变量之间单调相关的一般度量。有协方差的许多有用的直观的解释在这里

关于协方差与您提到的每个术语的关系:

(1) 相关性是协方差的缩放版本,其采用值,相关性表示完全线性关联,表示没有线性关系。这种缩放使相关性不变于原始变量的比例变化(Akavall指出并给出了+1的示例)。标度常数是两个变量的标准偏差的乘积。 [1,1]±10

(2)如果两个变量是独立的,则它们的协方差为。但是,协方差为并不意味着变量是独立的。这个数字(来自维基百科)00

                在此处输入图片说明

显示了几个非独立数据的示例图,但它们的协方差为。一个重要的特殊情况是,如果两个变量共同正态分布,则当且仅当它们不相关时,它们才是独立的。另一个特殊情况是,当且仅当伯努利变量对是独立的时,它们才是不相关的(感谢@cardinal)。0

(3)重复测量设计中的方差/协方差结构(通常简称为协方差结构)是指用于对以下事实进行建模的结构:对个体的重复测量可能具有相关性(因此是相关的),这是通过对重复测量的协方差矩阵中的项。一个示例是具有恒定方差可交换相关结构,结构指定每个重复的测量具有相同的方差,并且所有测量对均具有相同的相关性。更好的选择可能是指定一个协方差结构,该结构需要时间上相距较远的两次测量的相关性较低(例如自回归模型)。请注意,术语“协方差结构”更普遍地出现在允许观察值相关的多种多元分析中。


2
你的解释很好。它后面是有价值的补充,引起了一系列有趣的评论。非常感谢所有人:)!
stan

23

Macro的答案很好,但我想在协方差与相关性之间的联系上加点说明。协方差不会真正告诉您两个变量之间关系的强度,而相关性却可以。例如:

x = [1, 2, 3]
y = [4, 6, 10]

cov(x,y) = 2 #I am using population covariance here

现在让我们更改比例,将x和y乘以10

x = [10, 20, 30]
y = [40, 60, 100]

cov(x, y) = 200

更改比例不应该增加关系的强度,因此我们可以通过将协方差除以x和y的标准偏差来进行调整,这正是相关系数的定义。

在上述两种情况下,x和y之间的相关系数均为0.98198


6
“协方差并不能真正告诉您两个变量之间关系的强度,而相关性却可以。” 那句话是完全错误的。这两个量度是通过两个标准偏差得出的模数比例相同。
David Heffernan 2012年

15
@DavidHeffernan,是的,如果按标准偏差进行缩放,则协方差会告诉我们这种关系的强度。但是,协方差度量本身并不能告诉我们。
Akavall 2012年

10
@DavidHeffernan,我认为Akavall在说的是,如果您不知道变量的大小,那么协方差不会告诉您任何关于关系强度的信息-只能解释符号。
2012年

6
在什么实际情况下,您能否获得协方差而又无法获得对变量规模的良好估计?
David Heffernan'6

7
但是,不一定总要知道标准偏差才能了解变量的大小,从而了解关系的强度。非标准化的影响通常是有益的。例如,如果参加培训课程会使人们平均每年增加收入10,000美元,那可能是效果强度的更好指示,而不是说培训课程与收入之间存在ar = .34的相关性。
Jeromy Anglim 2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.