我以非常标准的方式使用卡尔曼滤波器。该系统由状态方程和观察方程。
教科书教导,在应用卡尔曼滤波器并获得“一步一步的预测”(或“滤波后的估计”)之后,我们应该使用它们来计算似然函数:
我的问题是:为什么似然函数是使用“过滤的估计” 而不是“平滑的估计” ?是不是状态向量的更好的估计?
我以非常标准的方式使用卡尔曼滤波器。该系统由状态方程和观察方程。
教科书教导,在应用卡尔曼滤波器并获得“一步一步的预测”(或“滤波后的估计”)之后,我们应该使用它们来计算似然函数:
我的问题是:为什么似然函数是使用“过滤的估计” 而不是“平滑的估计” ?是不是状态向量的更好的估计?
Answers:
要回答您的问题:您可以使用平滑密度。但是您不必。Jarle Tufto的答案包含您正在使用的分解。但是还有其他。
在这里,您将可能性评估为
但是,一般而言,均值和方差并不总是完全定义概率分布。以下是从过滤分布到条件似然:f (y i | y 1,... ,y i − 1)
这里, 是模型的状态迁移密度...部分,而再次是模型的观测密度...部分。在您的问题中,将它们分别写为和。这是同一件事。˚F (Ý 我| X 我)X 吨+ 1 = ˚F X 吨 + v 吨+ 1 Ŷ 吨 = ħ X 吨 + 甲ž 吨 + 瓦特吨
当您提前一个状态预测分布时,即计算。当您再次积分时,您将完全获得(1)。您在问题中完全写下了密度,这是同一回事。
在这里,您仅使用概率分布的分解以及关于模型的假设。该似然性计算是精确的计算。您可以使用任何自由裁量权来改善或降低此效果。
据我所知,在这种状态空间模型中没有其他方法可以直接评估可能性。但是,您仍然可以通过评估其他函数来进行最大似然估计:可以使用EM算法。在Expectation步骤(E-Step)中,您将计算 在这里f (y 1,… ,y n,x 1,… ,x n)
我读过一些地方,EM是使可能性最大化的“更稳定”的方法,但是我从来没有真正看到过这一点能很好地论证,也从未见过“稳定”这个词的定义,但是我也没有真的没有进一步检查。这些算法都无法绕过本地/全局最大折磨。我个人倾向于出于习惯而经常使用Kalman。
的确,状态的平滑估计通常比过滤具有较小的方差,因此我想您对此有一定的直觉是正确的,但您实际上并没有使用状态。您试图最大化的可能性不是状态的函数。
我认为关于“为什么”不使用平滑分布(通常)的一个更好的答案是效率。原则上,按照如下所述,在一触即发的意义上计算(平滑的)边际可能性很简单。删除观测值j,对其余数据运行Kalman平滑器。然后评估看不见的y(j)的可能性。对所有j重复此操作。总结对数可能性。更快的版本可以处理(随机)保留的样本块(例如k倍CV)。注意,该方案需要更通用的卡尔曼滤波器/平滑器实现,可以在需要时任意跳过测量更新。向后/平滑通过不访问测量值(无论如何都是RTS算法),并且保持不变。
如果时间序列“足够长”,那么这样做的好处可能很小,因为过滤的可能性“烧掉了”其初始瞬态。但是,如果数据集较短,则更值得的平滑可能性是值得的。固定滞后平滑器可能是介于两者之间的解决方案。