通过对相关观测值进行自举计算置信区间
如果观测值是iid,则标准形式的引导程序可用于计算估计统计量的置信区间。I.Visser 等。在“ 隐藏的马尔可夫模型参数的置信区间 ”中,使用了参数引导程序来计算HMM参数的CI。但是,当我们在观察序列上拟合HMM时,我们已经假设观察是相关的(与混合模型相反)。 我有两个问题: iid假设与引导程序有什么关系? 我们可以忽略参数引导程序中的iid要求吗? Visser 等。方法简述如下: 假设我们有一个观察序列是通过对HMM进行采样得到的,该HMM具有一组真实的但未知的参数。Y=o1,o2,...,onY=o1,o2,...,onY=o_1,o_2,...,o_nθ=θ1,θ2,...,θlθ=θ1,θ2,...,θl\theta=\theta_1,\theta_2,...,\theta_l 可以使用EM算法估算参数:θ^=θ^1,θ^2,...,θ^lθ^=θ^1,θ^2,...,θ^l\hat{\theta}=\hat{\theta}_1,\hat{\theta}_2,...,\hat{\theta}_l 使用估计的HMM生成大小为的引导程序样本:nnnY∗=o∗1,o∗2,...,o∗nY∗=o1∗,o2∗,...,on∗Y^*=o^*_1,o^*_2,...,o^*_n 根据引导程序样本估计HMM的参数:θ^∗=θ^∗1,θ^∗2,...,θ^∗lθ^∗=θ^1∗,θ^2∗,...,θ^l∗\hat{\theta}^*=\hat{\theta}^*_1,\hat{\theta}^*_2,...,\hat{\theta}^*_l 重复步骤3和4次(例如 = 1000),得出引导估计:乙乙θ *(1 ),θ *(2 ),。。。,θ *(乙)BBBBBBBBBθ^∗(1),θ^∗(2),...,θ^∗(B)θ^∗(1),θ^∗(2),...,θ^∗(B)\hat{\theta}^*(1),\hat{\theta}^*(2),...,\hat{\theta}^*(B) 使用引导程序估计中的分布来计算每个估计参数的CI 。 θ * 我θ^iθ^i\hat{\theta}_iθ^∗iθ^i∗\hat{\theta}^*_i 笔记(我的发现): 为了具有正确的覆盖范围,应该使用百分位数方法来计算CI(正态性是一个错误的假设)。 自举分布的偏差应得到纠正。意味着的分布均值应移至θ我θ^∗iθ^i∗\hat{\theta}^*_iθ^iθ^i\hat{\theta}_i