Answers:
参数估计值(例如样本均值或OLS回归系数)是样本统计信息,我们可用来得出有关相应总体参数的推论。人口参数是我们真正关心的,但是由于我们无法访问整个人口(通常假定为无限),因此必须改用这种方法。但是,这种方法会带来一些令人不舒服的事实。例如,如果我们再取一个样本,然后计算统计量以再次估计该参数,我们几乎肯定会发现它有所不同。而且,两个估计都不可能完全符合我们想要知道的真实参数值。实际上,如果我们一遍又一遍地进行下去,并继续进行永远的采样和估算,我们会发现不同估计值的相对频率遵循概率分布。中心极限定理表明该分布很可能是正态分布。我们需要一种量化该分布中不确定性量的方法。这就是标准错误为您执行的操作。
在您的示例中,您想知道总体中x1和y之间的线性关系的斜率,但是您只能访问样本。在您的样本中,该斜率是0.51,但是在不知道其对应的采样分布中有多少可变性的情况下,很难知道该数字的大小。在这种情况下,标准误差.05是该采样分布的标准偏差。要计算显着性,可以将估算值除以SE,然后在表上查找商。因此,较大的SE意味着较低的重要性。
残留标准偏差与斜率的采样分布无关。它只是您的样品在模型上的标准偏差。没有矛盾,也没有矛盾。至于如何使用R ^ 2高且只有40个数据点的较大SD,我想您会遇到范围限制的反面-您的x值分布非常广泛。