什么是偏差校正?[关闭]


12

我已经看到许多地方都有输入/输出数据集,它们首先创建线性回归线,更正了偏差,然后仅将该数据用于他们的模型。我没有得到这个偏差校正是什么?


6
我认为您可能需要提供参考或明确的示例,以便我们可以准确地知道您对此有何反应。
ub

@ naught101,请一次执行几个操作,不要向主页发送垃圾邮件。
gung-恢复莫妮卡

@gung:啊..你的意思是说几下然后再等一下?抱歉,为时已晚。我只找到10个左右,而我全都做了。忘记了首页效果:/如果只有SE具有不错的质量标记功能。
naught101

@gung:今天也许是首届偏差校正日:D
naught101

1
@ naught101单边批量重新标记有点不行,尤其是在您刚刚制作的标签上。广义上讲,最好在可行的情况下使用meta(以解释您的意图),如果似乎没有争议,则可以进行一些重新标记,但一次仅进行几次。
Glen_b-恢复莫妮卡

Answers:


11

尽管问题陈述不够精确,无法确切地知道您指的是哪种类型的偏差校正,但我认为我可以用一般的术语来谈论它。有时估算器可能会产生偏差。这仅意味着尽管它可能是一个很好的估计器,但其预期或平均值并不完全等于该参数。估算器的平均值与真实参数值之间的差异称为偏差。当已知一个估算器有偏差时,有时可以通过其他方式估算偏差,然后通过从原始估算值中减去估算的偏差来修改估算器。此过程称为偏差校正。这样做是为了改善估算值。虽然它将减少偏差,但也会增加方差。

成功的偏差校正的一个很好的例子是分类误差率的自举偏差校正估计。当样本量较小时,错误率的重新估计估计具有较大的乐观偏差。引导程序用于估计重新替换估计值的偏差,并且由于重新替换估计值低估了错误率,因此将偏差估计值添加到重新替换估计值中,以得到错误率的引导程序偏移校正后的估计值。当样本大小小于30或更少时,将两个类别中的两个类别组合在一起,则某些形式的引导估计(尤其是632估计)比留一法交叉验证提供的错误率更准确的估计(这是非常有用的)几乎无偏的错误率估算值)。


1
“虽然它将减少偏差,但也会增加差异。” -您能解释一下吗?不取决于方法吗?您基本上是说减少RMSE-最佳线性回归的偏差必然会增加RMSE,还是其他呢?
naught101
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.