在Kahneman and Deaton(2010),作者写道:
该回归解释了37%的方差,均方根误差(RMSE)为0.67852。为了消除异常值和不合理的收入报告,我们删除了一些观察结果,即原木收入与其预测之间的差异的绝对值超过了RMSE的2.5倍。
这是惯例吗?这样做的直觉是什么?根据一开始可能未明确指定的模型定义离群值似乎有些奇怪。异常值的确定是否应该基于构成合理值的某些理论依据,而不是模型对实际值的预测能力如何?
:丹尼尔·卡尼曼(Daniel Kahneman),安格斯·迪顿(Angus Deaton)(2010年):高收入可以改善人们对生活的评估,但不能改善情感幸福感。美国国家科学院院刊,2010年9月,107(38)16489-16493;DOI:10.1073 / pnas.1011492107