在Gelman&Hill(2007)的书(使用回归和多级/层次模型进行数据分析)中,作者声称包括冗余均值参数可以帮助加快MCMC。
给定的示例是“飞行模拟器”(公式13.9)的非嵌套模型:
他们建议重新参数化,并添加平均参数和,如下所示:
提供的唯一理由是(第420页):
仿真可能会陷入整个矢量(或)远离零的配置中(即使分配了均值为0的分布)。最终,模拟将收敛到正确的分布,但是我们不想等待。
冗余均值参数如何解决此问题?
在我看来,非嵌套模型的速度较慢,主要是因为和呈负相关。(实际上,如果一个总数上升,则另一个则必须下降,因为它们的总和被数据“固定”了)。冗余均值参数是否有助于降低和之间的相关性,或完全减少其他方面的相关性?
您是否正在寻找在这个特别的问题直观的洞察力(如是否是关联 -或相关 -和 -),或者你找对一般问题直观的洞察力(即分层居中的概念)?在后一种情况下,您是否希望直觉接近于证明或直觉更宽松,或多或少显示出其工作原理?
—
Sextus Empiricus
我希望对一般的层次中心化概念有直观的了解(因为问题中的特殊情况直接是层次中心化的应用)。我想了解的关键点是:如果组级别的差异占总差异的很大一部分,为什么分层居中工作?Gelfand等人的论文。用数学方法证明了这一点(即推导相关性并找到其极限行为),但没有任何直观的解释。
—
海森堡