Answers:
如您在问题中所述,饶-布莱克威尔粒子滤波器(RBPF)对状态空间的概率分布进行边际化。
粒子过滤器使用采样来表示状态空间的多元概率分布。首先,使用样本表示分布只是一个近似值,其次,在大多数情况下效率不高。状态的维数越高,所需的粒子越多。Doucet等人介绍的一种技巧。是要边缘化状态空间的一个子集,可以使用高斯表示以更有效的方式对其进行处理。
我论文中的这些数字可能有助于形象化这一概念。假设您在和有一个联合分布
不必在和共同采样,我们可以将边缘化并将其表示为高斯分布。这样,我们只需要对进行采样,
效率更高。注意,每个样本现在代表的分布。
这种边缘化在SLAM中非常流行。原因是对位置和地图进行联合采样是不切实际的。RBPF想法在FastSLAM中变得很流行,因为意识到从联合分布中边缘化地图会使问题变得容易解决。如上例所示,每个粒子代表一个姿势,对应关系和一个映射。因此,每个粒子只有一张贴图。
因此,RBPF和常规粒子滤波器之间的区别在于,RBPF在状态概率分布的子空间上进行采样,并使用不同的统计量表示其余部分。关于Rao-Blackwellization部分的数学背景,我还有另一个相关问题。