3
回归平均谜题
在丹尼尔·卡尼曼(Daniel Kahneman)的“思考,快速和慢速”的“回归均值”一章中,给出了一个示例,并要求读者根据整体销售预测和上一年的销售数量来预测各个商店的销售。例如(这本书的示例有4家商店,为简单起见,我在这里使用2家): Store 2011 2012 1 100 ? 2 500 ? Total 600 660 天真的预测是商店1和2分别为110和550,每个商店增加10%。但是,作者声称这种幼稚的方法是错误的。绩效较差的商店更有可能增加10%以上,而绩效较好的商店则增加(甚至减少)少于10%。因此,预测115(增加15%)和535(增加7%)将比幼稚的预测“更正确”。 我不明白的是,我们如何得出结论,商店1的销售额为100必然是表现较差的商店?也许由于位置差异,商店1和2的真实时间序列平均值是10和550,商店1在2011年是超级年份,商店2在2011年是灾难性年份。那么这没有道理吗预测商店1的减少和商店2的增加? 我知道原始示例中未提供时间序列信息,但我的印象是“均值回归”是指横截面均值,因此时间序列信息并不重要。我有什么误会?