Answers:
协方差是一个变量的变化与第二个变量的变化如何关联的度量。具体而言,协方差度量两个变量线性关联的程度。但是,它也经常非正式地用作两个变量之间单调相关的一般度量。有协方差的许多有用的直观的解释在这里。
关于协方差与您提到的每个术语的关系:
(1) 相关性是协方差的缩放版本,其采用值,相关性表示完全线性关联,表示没有线性关系。这种缩放使相关性不变于原始变量的比例变化(Akavall指出并给出了+1的示例)。标度常数是两个变量的标准偏差的乘积。
(2)如果两个变量是独立的,则它们的协方差为。但是,协方差为并不意味着变量是独立的。这个数字(来自维基百科)
显示了几个非独立数据的示例图,但它们的协方差为。一个重要的特殊情况是,如果两个变量共同正态分布,则当且仅当它们不相关时,它们才是独立的。另一个特殊情况是,当且仅当伯努利变量对是独立的时,它们才是不相关的(感谢@cardinal)。
(3)重复测量设计中的方差/协方差结构(通常简称为协方差结构)是指用于对以下事实进行建模的结构:对个体的重复测量可能具有相关性(因此是相关的),这是通过对重复测量的协方差矩阵中的项。一个示例是具有恒定方差的可交换相关结构,该结构指定每个重复的测量具有相同的方差,并且所有测量对均具有相同的相关性。更好的选择可能是指定一个协方差结构,该结构需要时间上相距较远的两次测量的相关性较低(例如自回归模型)。请注意,术语“协方差结构”更普遍地出现在允许观察值相关的多种多元分析中。
Macro的答案很好,但我想在协方差与相关性之间的联系上加点说明。协方差不会真正告诉您两个变量之间关系的强度,而相关性却可以。例如:
x = [1, 2, 3]
y = [4, 6, 10]
cov(x,y) = 2 #I am using population covariance here
现在让我们更改比例,将x和y乘以10
x = [10, 20, 30]
y = [40, 60, 100]
cov(x, y) = 200
更改比例不应该增加关系的强度,因此我们可以通过将协方差除以x和y的标准偏差来进行调整,这正是相关系数的定义。
在上述两种情况下,x和y之间的相关系数均为0.98198
。