Answers:
通常,变量选择技术(无论是逐步,向后,向前,所有子集,AIC等)都利用样本数据中总体中不存在的机会或随机模式。这个技术术语过拟合,尽管不是专用于小型数据集,但它尤其成问题。通过使用基于最佳拟合选择变量的过程,看起来像适合此特定样本的所有随机变化都会导致估计值和标准误差。这两个都是问题模型的预测和解释。
具体来说,r平方太高,参数估计值有偏差(距离0太远),参数的标准误差太小(因此p值和参数周围的间隔太小/太窄)。
应对这些问题的最佳方法是周到地构建模型,并包括基于理论,逻辑和先前知识有意义的预测变量。如果需要变量选择程序,则应选择一种通过调整参数和标准误差以补偿过度拟合来惩罚参数估计值的方法(收缩方法)。一些常见的收缩方法是脊回归,最小角度回归或套索。此外,使用训练数据集和测试数据集或模型平均进行交叉验证对于测试或减少过度拟合的影响可能很有用。
Harrell是详细讨论这些问题的好地方。 哈雷尔(2001)。“回归建模策略”。
在我来自的社会科学环境中,问题是您是否对(a)预测或(b)测试重点研究问题感兴趣。如果目的是预测,那么数据驱动的方法是合适的。如果目的是研究重点研究问题,那么重要的是考虑哪种回归模型专门测试您的问题。
例如,如果您的任务是选择一组选择测试来预测工作绩效,则从某种意义上讲,该目标可以被视为最大化对工作绩效的预测之一。因此,数据驱动的方法将是有用的。
相反,如果您想了解人格变量和能力变量在影响绩效中的相对作用,则使用特定的模型比较方法可能更合适。
通常,在探索重点研究问题时,其目的是阐明一些潜在的因果过程,而不是开发具有最佳预测的模型。
当我基于横截面数据开发有关过程的模型时,我会警惕:(a)包括理论上可以认为是结果变量后果的预测变量。例如,一个人认为自己表现出色,可以很好地预测工作绩效,但这很可能至少部分是由于他们观察了自己的绩效而造成的。(b)包含大量均能反映同一潜在现象的预测变量。例如,包括20个项目,这些项目均以不同方式衡量对生活的满意度。
因此,重点研究问题更多地取决于领域特定的知识。这大概可以解释为什么在社会科学中较少使用数据驱动的方法。
理查德·伯克(Richard Berk)在最近的一篇文章中通过仿真演示了这种数据监听和统计推断的问题。正如罗伯(Rob)所建议的那样,这比简单地校正多个假设检验要困难得多。
选择模型后的统计推断 作者:理查德·伯克(Richard Berk),劳伦斯·布朗(Lawrence Brown),琳达·赵(Linda Zhao)。26,No. 2(2010年6月1日),第217-236页。
此处为 PDF版本
如果我对您的问题理解正确,那么对您的问题的答案就是根据假设的数量更正p值。
例如Holm-Bonferoni校正,您可以根据假设的p值对假设(=不同的模型)进行排序,而拒绝那些具有ap samller大于(期望的p值/指数)的假设。
有关该主题的更多信息,请参见Wikipedia。