如何基于数据不确定性(可能在Excel / Mathematica中)计算线性回归斜率的不确定性?
示例: 让我们有数据点(0,0),(1,2),(2,4),(3,6),(4,8),...(8、16),但是每个y值都有不确定性为4。我发现,大多数函数会将不确定性计算为0,因为这些点与函数y = 2x完全匹配。但是,如图所示,y = x / 2也与这些点匹配。这是一个夸张的例子,但我希望它能说明我的需求。
编辑:如果我尝试解释更多,而示例中的每个点都有y的某个值,我们假装不知道这是真的。例如,第一个点(0,0)实际上可以是(0,6)或(0,-6)或介于两者之间的任何值。我要问的是,在任何流行的问题中都没有考虑到这一点的算法。在示例中,点(0,6),(1,6.5),(2,7),(3,7.5),(4,8),...(8、10)仍落在不确定性范围内,因此它们可能是正确的点,并且连接这些点的线具有一个方程:y = x / 2 + 6,而我们通过不考虑不确定性而得到的方程为:y = 2x +0。因此,k的不确定性是1,5,而n是6。
TL; DR:在图片中,有一条y = 2x线是使用最小二乘拟合计算得出的,并且可以完美拟合数据。我试图找出y = kx + n中的k和n可以改变多少,但是如果我们知道y值的不确定性,仍然可以拟合数据。在我的示例中,k的不确定度为1.5,n的不确定度为6。在图像中,有“最佳”拟合线和一条刚好适合这些点的线。