4
关于乔治·博克斯(George Box),加利特·斯穆利(Galit Shmueli)和科学方法?
(这个问题似乎更适合于哲学SE。我希望统计学家可以澄清我对Box和Shmueli陈述的误解,因此我将其张贴在这里)。 ARIMA名望的George Box说: “所有模型都是错误的,但有些是有用的。” Galit Shmueli在她著名的论文“ To Explain or Predict”中指出(并引用了其他同意她的观点): 解释和预测并不相同,尽管某些模型在预测方面做得不好,但有些模型在解释方面做得很好。 我觉得这些与原则有些矛盾。 如果模型预测不好,是否有用? 更重要的是,如果模型能够很好地解释(但不一定能很好地预测),那么它在某种程度上必须是正确的(即没有错)。那么,这与Box的“所有模型都错了”又有什么关系呢? 最后,如果一个模型能够很好地解释但不能很好地预测,那么它如何科学?大多数科学标界标准(验证论,证伪论等)都暗示科学陈述必须具有预测能力,或者口语化:只有经过实证检验(或证伪)的理论或模型才是正确的。必须预测未来的结果。 我的问题: Box的陈述与Shmueli的观点是否确实矛盾,或者我是否缺少某些东西,例如,一种没有预测能力的模型仍然有用吗? 如果Box和Shmueli的陈述不矛盾,那么对一个模型错误并不能很好地预测却仍然具有解释力意味着什么?换句话说:如果一个人既丧失了正确性又缺乏预测能力,那么模型还剩下什么? 当模型具有解释力但没有预测力时,可以进行哪些经验验证?Shmueli提到了类似的事情:使用AIC进行解释,使用BIC进行预测,等等,但是我不知道这是如何解决问题的。对于预测模型,您可以使用AIC,BIC或R2R2R^2或L1L1L1正则化等,但是最终出于样本测试和生产性能的决定因素决定了模型的质量。但是对于解释得很好的模型,我看不到任何损失函数如何能够真正评估模型。在科学哲学中,存在不确定性的概念对于任何给定的数据集,总可以明智地选择某种分布(或分布的混合)和损失函数LLL,使其适合数据(因此可以声称可以解释它)。此外,对于有人声称模型足以解释数据的情况,LLL应当处于的阈值是任意的(类似p值,为什么p<0.05p<0.05p < 0.05而不是p<0.1p<0.1p < 0.1或p<0.01p<0.01p < 0.01?)。 基于以上所述,由于不可能进行样本外测试,因此如何客观地验证可以很好地解释但不能很好地预测的模型?