背景:我目前正在做一些比较各种贝叶斯层次模型的工作。数据是参与者i和时间j的幸福感的数字量度。我大约有1000位参与者,每位参与者5到10个观察值。
像大多数纵向数据集一样,我希望看到某种形式的自相关,其中时间上较近的观测值比距离较远的观测值具有更大的相关性。简化几件事,基本模型如下:
我在比较无滞后模型的地方:
使用滞后模型:
其中是一个人级的均值和β
我得到的结果表明:
- 滞后参数约为0.18,95%CI [.14,.21]。即非零
- 当模型中包含滞后时,平均偏差和DIC都会增加数百
- 后验预测检查表明,通过包括滞后效应,模型可以更好地恢复数据中的自相关
因此,总的来说,非零滞后参数和后验预测表明滞后模型更好。但均值偏差和DIC表明无滞后模型更好。这让我感到困惑。
我的一般经验是,如果添加有用的参数,则至少应减少平均偏差(即使在复杂度降低后DIC也不会得到改善)。此外,滞后参数的零值将实现与无滞后模型相同的偏差。
题
为什么即使滞后参数不为零并且增加滞后效应,也可以增加贝叶斯分层模型中的平均偏差,从而改善后验预测性检查?
最初的想法
- 我已经做了很多 收敛性检查(例如,查看轨迹图;检查跨链和跨运行的偏差结果的变化),并且两个模型似乎都收敛于后验。
- 我已经执行了代码检查,将滞后效应强制为零,这确实恢复了无滞后模型偏差。
- 我还研究了平均偏差减去惩罚值,该偏差值应使偏差超出预期值,这也使滞后模型显得更糟。
- 我如何估计第一次观察之前的隐含时间点可能存在一些问题。
- 在此数据中,滞后效应可能只是微弱的
- 我尝试使用
lme
与的最大相似度来估计模型correlation=corAR1()
。滞后参数的估计值非常相似。在这种情况下,与没有滞后的模型相比,滞后模型具有更大的对数可能性和较小的AIC(大约100)(即,它表明滞后模型更好)。因此,这加强了这样的想法,即增加滞后还应降低贝叶斯模型中的偏差。 - 贝叶斯残差也许有一些特殊之处。如果滞后模型使用前一时间点的预测y与实际y之差,则此数量将不确定。因此,滞后效应将在此类残值的可靠区间内运行。