不幸的是,这个问题并没有有一个很好的答案。您可以基于以下事实来选择最佳模型:使用最小化绝对误差,平方误差,最大化似然性的事实,使用一些惩罚似然性的标准(例如AIC,BIC)来提及一些最常见的选择。问题在于,这两个标准都不会让您选择客观上最佳的模型,而是您选择的最佳模型。另一个问题是,在进行优化时,您总会遇到一些局部最大值/最小值。另一个问题是您对模型选择标准的选择是主观的。在许多情况下,您有意识地或半意识地决定您对什么感兴趣,并根据此选择标准。对于例如,则使用BIC而不是AIC会导致模型更简化,参数更少。通常,对于建模,您会对更简约的模型感兴趣,这些模型可以得出有关宇宙的一些一般性结论,而对于预测它却不一定如此,有时更复杂的模型可以具有更好的预测能力(但不一定而且通常如此)它不是)。在其他情况下,出于实际原因,有时优选更复杂的模型,例如,在使用MCMC估计贝叶斯模型时,具有分层超优先级的模型在仿真中的表现要比简单模型好。另一方面,通常我们担心过度拟合模型越简单,过度拟合的风险就越低,因此这是一个较安全的选择。一个很好的例子是自动逐步模型选择,通常不建议这样做,因为它容易导致估计值过拟合和偏差。还有一个哲学上的论点,奥卡姆的剃刀,认为最简单的模型是首选。还要注意,我们在这里讨论的是比较不同的模型,而在现实生活中也可以这样,使用不同的统计工具可以得出不同的结果-因此,选择方法还有另外一层!
所有这些导致我们无法确定的令人伤心但有趣的事实。我们从不确定性开始,使用方法来处理不确定性,最后导致不确定性。这可能是自相矛盾的,但请记住我们使用统计数据是因为我们认为世界是不确定的和概率性的(否则我们会选择先知的职业),那么我们怎么可能得出不同的结论呢?没有客观的停止规则,有多种可能的模型,所有这些模型都是错误的(陈词滥调!),因为它们试图简化复杂的(不断变化和概率性的)现实。我们发现其中一些对我们的目的比其他一些有用,有时我们做到了θμ
您可以更深入地发现,现实中不存在“概率”之类的东西-它只是我们周围不确定性的近似值,并且还有其他近似方法,例如模糊逻辑(请参阅Kosko,1993年)供讨论)。甚至我们的方法所基于的非常基本的工具和定理都是近似值,并不是唯一可行的方法。我们根本无法确定这样的设置。
您正在寻找的停止规则始终是针对特定问题和主观的,即基于所谓的专业判断。顺便说一下,有很多研究实例表明,专业人员的判断力通常不如外行人,有时甚至更差(例如,丹尼尔·卡尼曼(Daniel Kahneman)在论文和书中复活的人),但他们更容易产生过度自信(实际上这是事实)。为什么我们要一个参数不尝试是“肯定”我们的模型)。
Kosko,B。(1993)。模糊思维:模糊逻辑的新科学。纽约:Hyperion。