Answers:
在设计实验时,这是一个重要的考虑因素,在这种情况下,可能需要估计之间没有(或很少)相关性 和 。这种缺乏相关性可以通过控制。
分析效果 根据估算值 (是长度为行的向量 )垂直组装成矩阵 中,设计矩阵,因为有数据和(显然)两列具有尽可能多的行。相应的 被组装成一个长(列)向量 。在这些方面,写作 对于组装系数,模型为
的 (通常)假定为独立随机变量,其方差为常数 对于一些未知 。相关观察 被视为向量值随机变量的一种实现 。
OLS解决方案是
假设这个矩阵逆存在。因此,利用矩阵乘法和协方差的基本属性,
矩阵 只有两行两列,对应于模型参数 。的相关性 与 与...的非对角线元素成比例 根据克莱默法则,它与两列的点积成比例。由于其中一列是全部s,其点积与另一列(由 )是他们的总和,我们发现
和 是不相关的,当且仅当 是零。
这种正交条件常常被实现recentering的(通过从中减去它们的均值)。虽然这不会改变估计的斜率,它的确会改变估计的截距 。这是否重要取决于应用程序。
该分析适用于多元回归:设计矩阵将具有 列 自变量(附加列包括 s)和 将是长度的向量 ,但除此之外,一切都会像以前一样进行。
用常规语言,两列 当它们的点积为零时称为正交。当一列 (例如列 )与所有其他列正交,这是一个容易证明的代数事实,即行中所有非对角线的条目 和列 的 为零(即 和 所有组件 为零)。所以,
两个多元回归系数估计 和 每当设计矩阵的相应列中的任意一个(或两个)与所有其他列正交时,它们是不相关的。
许多标准实验设计包括选择自变量的值以使列相互正交。通过保证在收集任何数据之前“分离”最终的估计,这些估计将是不相关的。(当响应具有正态分布时,这意味着估计将是独立的,这大大简化了它们的解释。)