在所有情况下,我都熟悉交叉验证,它仅用于提高预测准确性的目的。可以在估计变量之间的无偏关系时扩展交叉验证的逻辑吗?
尽管理查德·伯克(Richard Berk)的这篇论文演示了在“最终”回归模型中使用保留样本进行参数选择的情况(并演示了为什么逐步选择参数不是一个好主意),但我仍然看不到如何完全确保与基于逻辑和对象的先验知识选择模型相比,X对Y产生的影响的无偏估计不再是。
我要求人们举出一些例子,其中有人使用保留样本来帮助进行因果推论,或者使用一些一般性的文章来帮助我理解。我也毫不怀疑我的交叉验证概念是幼稚的,因此可以这么说。使用暂留样本似乎可以进行因果推断,但是我不知道有任何工作可以做到这一点,或者他们将如何做到这一点。
伯克论文的引文:
模型选择后的统计推断 ,作者:理查德·伯克(Richard Berk),劳伦斯·布朗(Lawrence Brown),琳达·赵(Linda Zhao)。26,No. 2(2010年6月1日),第217-236页。
此处为 PDF版本
这对由CHL小样本研究探索性数据分析问题促使这个问题。