也许通过简化表示法,我们可以提出基本思想。 事实证明,我们不需要涉及期望或复杂的公式,因为所有内容都是纯代数的。
数学对象的代数性质
问题涉及(1)随机变量的有限集的协方差矩阵与(2)这些变量之间的线性关系(被视为向量)之间的关系。X1,…,Xn
所讨论的向量空间是所有有限方差随机变量(在任何给定的概率空间)的集合,以几乎肯定恒定的变量的子空间为模,表示为 (也就是说,当与期望值不同的可能性为零时,我们将两个随机变量和视为相同的向量。)我们仅处理有限维向量生成的空间这就是使它成为代数问题而不是解析问题的原因。大号 2(Ω ,P)/ [R 。X Y X − Y V X i,(Ω,P)L2(Ω,P)/R.XYX−YVXi,
我们需要了解的方差
V不仅仅是一个向量空间:它是一个二次模块,因为它配备了方差。 我们需要了解的关于方差的两件事:
方差是一个标量值函数,对于所有向量,其属性Q (a X )= a 2 Q (X )X 。QQ(aX)=a2Q(X)X.
方差是非简并的。
第二个需要一些解释。 确定一个“点积”,它是由给出的对称双线性形式Q
X⋅Y=14(Q(X+Y)−Q(X−Y)).
(这是当然无非变量的协方差其他和)载体和是正交时,他们的点积为 的正交补任何一组的矢量的包含的所有矢量正交写入每个元素ÿ 。X ÿ 0 甲 ⊂ V 甲,XY.XY0.A⊂VA,
A0={v∈V∣a.v=0 for all v∈V}.
显然,它是一个向量空间。当,不退化。QV0={0}Q
让我证明方差确实是不退化的,即使它看起来似乎很明显。假设是一个非零元素 这意味着对于所有等效地,V 0。X ⋅ ÿ = 0 ý ∈ V ;XV0.X⋅Y=0Y∈V;
Q(X+Y)=Q(X−Y)
对于所有向量 取得出Y = XY.Y=X
4Q(X)=Q(2X)=Q(X+X)=Q(X−X)=Q(0)=0
因此 但是,我们知道(也许使用切比雪夫不等式),唯一具有零方差的随机变量几乎可以肯定是恒定的,从而用 QED中的零向量来标识它们。V ,Q(X)=0.V,
解释问题
回到问题,在前面的符号中,随机变量的协方差矩阵只是其所有点积的规则数组,
T=(Xi⋅Xj).
有一个很好的思考:通过发送任何向量,它以通常的方式在上定义线性变换。进入向量其分量由矩阵乘法规则给出ř Ñ X = (X 1,... ,X Ñ)∈ [R Ñ Ť (X )= Ý = (Ý 1,... ,X Ñ)我个TRnx=(x1,…,xn)∈RnT(x)=y=(y1,…,xn)ith
yi=∑j=1n(Xi⋅Xj)xj.
此线性变换的核心是它发送为零的子空间:
Ker(T)={x∈Rn∣T(x)=0}.
前述等式意味着,当对于每个我x∈Ker(T),i
0=yi=∑j=1n(Xi⋅Xj)xj=Xi⋅(∑jxjXj).
由于对于每个都是如此因此它适用于跨越的所有向量:即本身。因此,当由给出的向量位于 因为方差是非退化的,这意味着 也就是说,描述了原始随机变量之间的线性相关性。X 我 V X ∈ ker的(Ť ),Σ Ĵ X Ĵ X Ĵ V 0。Σ Ĵ X Ĵ X Ĵ = 0 X Ñi,XiVx∈Ker(T),∑jxjXjV0.∑jxjXj=0.xn
您可以随时检查此推理链是否可逆:
作为向量之间的线性相关性与的内核元素一一对应牛逼。Xj T.
(请记住,该语句仍然将定义为位置不断变化的位置,也就是说,作为元素,而不是只是随机变量。)L 2(Ω ,P)/ RXjL2(Ω,P)/R
最后,根据定义,一个特征值的是任何标量存在用于其非零矢量与 当是一个特征值时,关联的特征向量的空间(显然)是的核λ X Ť (X )= λ X 。λ = 0 Ť 。TλxT(x)=λx.λ=0T.
摘要
我们已经得出以下问题的答案:随机变量的线性相关性集合 qua元素与…一对一对应他们的协方差矩阵的内核 这是因为方差是一个非简并二次形式。内核也是与零特征值关联的特征空间(或者在没有零特征值时仅为零子空间)。T。L2(Ω,P)/R,T.
参考
我在很大程度上采用了第四章的符号和某些语言。
Jean-Pierre Serre,算术课程。 施普林格出版社1973。