我正在尝试解决最小角度回归(LAR)问题。这是一个问题3.23页面上97的黑斯蒂等,统计学习的要素,第2位。ed。(第5次打印)。
考虑所有变量和响应均值为零,标准差为1的回归问题。还假设每个变量与响应具有相同的绝对相关性:
令为上最小二乘系数,并令为。
要求我显示 ,我对此有疑问。请注意,这基本上可以说,随着我们向前进,每个与残差的相关性在大小上保持相等。
我也不知道如何显示相关性等于:
任何指针将不胜感激!
我正在尝试解决最小角度回归(LAR)问题。这是一个问题3.23页面上97的黑斯蒂等,统计学习的要素,第2位。ed。(第5次打印)。
考虑所有变量和响应均值为零,标准差为1的回归问题。还假设每个变量与响应具有相同的绝对相关性:
令为上最小二乘系数,并令为。
要求我显示 ,我对此有疑问。请注意,这基本上可以说,随着我们向前进,每个与残差的相关性在大小上保持相等。
我也不知道如何显示相关性等于:
任何指针将不胜感激!
Answers:
这是问题3.23页面上97的黑斯蒂等,统计学习的要素,第2位。ed。(第5次打印)。
这个问题的关键是对普通最小二乘法(即线性回归)的良好理解,尤其是拟合值和残差的正交性。
正交引理:设为设计矩阵,为响应向量,为(真)参数。假设是满秩(我们将在整个)的OLS估计是。拟合值为。然后。即,拟合值与残差正交。这是因为。
现在,令为列向量,使为第列。假定的条件是:
请注意,特别是,在最后陈述正交引理是相同的所有。
相关性是并列的
现在,。因此, 并且由于正交引理在右边的第二项为零,因此 根据需要)。相关的绝对值就是
注意:上面的右侧与无关,并且分子与协方差相同,因为我们假设所有和都居中(因此,尤其是不必减去均值)。
重点是什么?随着增加,响应矢量将被修改,使其朝着仅通过在模型中合并第一个参数而获得的(受限!)最小二乘法求解的方向扩展。这同时修改了估计的参数,因为它们是预测变量与(修改的)响应向量的简单内积。修改采取特殊形式。在整个过程中,它使预测变量和修改后的响应之间的相关性(的幅值)保持相同(即使相关性的值正在变化)。考虑一下这是怎么做的,您将了解该过程的名称!
(绝对)相关的显式形式
让我们集中讨论分母中的术语,因为分子已经是必需的形式。我们有
代入并使用内积的线性,我们得到
观察一下
放在一起,您会发现我们得到了
总结一下,,因此很显然,在和单调递减为。
结语:在这里集中思想。真的只有一个。该正交引理做几乎所有的工作我们。剩下的只是代数,符号,以及将后两个函数起作用的能力。