统计和大数据 explanatory-models

4

关于乔治·博克斯（George Box），加利特·斯穆利（Galit Shmueli）和科学方法？

（这个问题似乎更适合于哲学SE。我希望统计学家可以澄清我对Box和Shmueli陈述的误解，因此我将其张贴在这里）。 ARIMA名望的George Box说： “所有模型都是错误的，但有些是有用的。” Galit Shmueli在她著名的论文“ To Explain or Predict”中指出（并引用了其他同意她的观点）：解释和预测并不相同，尽管某些模型在预测方面做得不好，但有些模型在解释方面做得很好。我觉得这些与原则有些矛盾。如果模型预测不好，是否有用？更重要的是，如果模型能够很好地解释（但不一定能很好地预测），那么它在某种程度上必须是正确的（即没有错）。那么，这与Box的“所有模型都错了”又有什么关系呢？最后，如果一个模型能够很好地解释但不能很好地预测，那么它如何科学？大多数科学标界标准（验证论，证伪论等）都暗示科学陈述必须具有预测能力，或者口语化：只有经过实证检验（或证伪）的理论或模型才是正确的。必须预测未来的结果。我的问题： Box的陈述与Shmueli的观点是否确实矛盾，或者我是否缺少某些东西，例如，一种没有预测能力的模型仍然有用吗？如果Box和Shmueli的陈述不矛盾，那么对一个模型错误并不能很好地预测却仍然具有解释力意味着什么？换句话说：如果一个人既丧失了正确性又缺乏预测能力，那么模型还剩下什么？当模型具有解释力但没有预测力时，可以进行哪些经验验证？Shmueli提到了类似的事情：使用AIC进行解释，使用BIC进行预测，等等，但是我不知道这是如何解决问题的。对于预测模型，您可以使用AIC，BIC或R2R2R^2或L1L1L1正则化等，但是最终出于样本测试和生产性能的决定因素决定了模型的质量。但是对于解释得很好的模型，我看不到任何损失函数如何能够真正评估模型。在科学哲学中，存在不确定性的概念对于任何给定的数据集，总可以明智地选择某种分布（或分布的混合）和损失函数LLL，使其适合数据（因此可以声称可以解释它）。此外，对于有人声称模型足以解释数据的情况，LLL应当处于的阈值是任意的（类似p值，为什么p<0.05p<0.05p < 0.05而不是p<0.1p<0.1p < 0.1或p<0.01p<0.01p < 0.01？）。基于以上所述，由于不可能进行样本外测试，因此如何客观地验证可以很好地解释但不能很好地预测的模型？

16 predictive-models aic bic philosophical explanatory-models

1

最小化解释模型中的偏见，为什么？（Galit Shmueli的“解释或预测”）

这个问题参考了Galit Shmueli的论文“解释或预测”。具体而言，Shmueli教授在1.5节“解释和预测不同”中写道：在解释性建模中，重点是最小化偏差以获得最准确的基础理论表示。每当我读这篇论文时，这都会使我感到困惑。从什么意义上说，最小化估计偏差可以最准确地表示基础理论吗？我还在这里观看了Shmueli教授在2017年JMP探索峰会上的演讲，她说： ...像收缩模型，集合体之类的东西，您将永远不会看到它们。因为这些模型通过设计引入了偏差，以减少总体偏差/方差。这就是为什么他们不在那里的原因，这样做没有任何理论意义。您为什么要使模型有目的地偏见？这并不能真正阐明我的问题，只是重申我不理解的说法。如果理论有很多参数，而我们没有足够的数据来估计它们，那么估计误差将由方差决定。为什么在这种情况下使用像岭回归这样的有偏估计程序（导致较低方差的有偏估计）是不合适的？

15 predictive-models inference bias unbiased-estimator explanatory-models

1

LASSO用于解释性模型：参数是否缩小？

我正在进行分析，其主要目标是了解数据。数据集足够进行交叉验证（10k），并且预测变量包括连续变量和虚拟变量，并且结果是连续的。主要目标是查看踢出一些预测变量是否有意义，以使模型更易于解释。问题：我的问题是“哪些变量解释了结果，并且是该解释的“足够强的”部分”。但是要为套索选择lambda参数，可以使用交叉验证，即预测有效性作为准则。在进行推断时，预测效度是否足以代替我要问的一般问题？说LASSO仅保留了8个预测变量中的3个。现在我问自己：“这些对结果有什么影响”。例如，我发现了性别差异。套索收缩后，该系数表明女性得分比男性高1分。但是没有缩水（即在实际数据集上），它们的得分高出2.5分。我将哪一个作为我的“真实”性别效果？仅根据预测效度，它将是收缩系数。或者说，我正在为不精通统计的人们编写报告。我要向他们报告哪个系数？

9 lasso explanatory-models

Questions tagged «explanatory-models»