在线性回归中,我们做出以下假设
解决线性回归的方法之一是通过正态方程,我们可以写成
从数学的角度来看,上述等式仅需要是可逆的。那么,为什么我们需要这些假设呢?我问了几个同事,他们提到这是要获得良好的结果,而正规方程是实现该目标的算法。但是在那种情况下,这些假设有何帮助?坚持使用它们如何有助于建立更好的模型?
2
需要使用正态分布来使用常用公式计算系数置信区间。CI计算的其他公式(我认为是怀特)允许非正态分布。
—
keiv.fly
您不一定总是需要这些假设才能使模型起作用。在神经网络中,您内部具有线性回归,就像您提供的公式一样,它们使均方根值最小化,但最有可能的假设都不成立。没有正态分布,没有相等的方差,没有线性函数,甚至误差也可以是相关的。
—
keiv.fly
@Alexis作为iid的自变量绝对不是一个假设(并且作为iid的因变量也不是一个假设-想象一下,如果我们假设响应为iid,那么除了估计均值之外,做任何事情都是没有意义的)。“避免遗漏的变量”并不是真正的附加假设,尽管最好避免省略变量-列出的第一个假设确实可以解决这个问题。
—
戴森
@Dason我认为我的链接提供了一个非常有力的例子,即“无遗漏的变量”是有效解释的必要条件。我也认为iid(取决于预测变量,是必要的)是必要的,随机游走提供了一个很好的例子,说明非iid估计可能会失败(曾经仅求平均值)。
—
亚历克西斯