卡尔曼滤波和(必要时重复)最小二乘多项式回归之间的关系(如果有)?
卡尔曼滤波和(必要时重复)最小二乘多项式回归之间的关系(如果有)?
Answers:
1.最佳标准方面有所不同
卡尔曼滤波器是线性估计器。它是线性的最佳估计量 -即从间接,不准确和不确定的观察结果中推断出感兴趣的模型参数。
但是最佳意义是什么?如果所有噪声均为高斯噪声,则卡尔曼滤波器将估计参数的均方误差最小化。这意味着,当基础噪声不是高斯噪声时,承诺将不再成立。在非线性动力学的情况下,众所周知,状态估计的问题变得困难。在这种情况下,没有任何一种过滤方案明显胜过所有其他策略。在这种情况下,如果非线性估算器可以使用附加信息更好地对系统进行建模,则可能会更好。[见参考文献1-2]
多项式回归是线性回归的一种形式,其中将自变量x和因变量y之间的关系建模为n阶多项式。
注意,尽管多项式回归将非线性模型拟合到数据,但从估计的角度来看,这些模型都是线性的,因为就未知参数而言,回归函数是线性的。如果我们将视为不同的变量,则多项式回归也可以视为多元线性回归。
多项式回归模型通常使用最小二乘法进行拟合。同样在最小二乘法中,我们使均方误差最小。在高斯-马尔可夫定理的条件下,最小二乘法最小化了系数的无偏估计量的方差。该定理指出,在以下条件下,普通最小二乘(OLS)或线性最小二乘是最佳线性无平衡估计器(BLUE):
一种。当错误的期望值为零时,即
b。具有相等的方差,即
c。和错误是不相关的,即
注意:这里的错误不必是高斯型的,也不必是IID的。它只需要是不相关的。
2.卡尔曼滤波器是最小二乘估计量的演化
1970年,索伦森(HW Sorenson)发表了IEEE频谱文章,标题为“最小二乘估计:从高斯到卡尔曼。 ” [请参见参考文献3。]这是一篇开创性的论文,它提供了关于高斯最初的最小二乘思想如何与当今的现代技术相结合的重要见解。像卡尔曼这样的估算者。
高斯的工作不仅引入了最小二乘框架,而且实际上是最早使用概率观点的工作之一。尽管最小二乘以各种回归方法的形式演变,但还有另一项关键工作使滤波器理论被用作估计量。
用于固定时间序列估计的滤波理论是由诺伯特·维纳(Norbert Wiener)在1940年代(第二次世界大战期间)构建的,并于1949年发布,现在被称为维纳滤波器。该工作完成得较早,但直到第二次世界大战后才进行分类。Wiener工作的离散时间等效项由Kolmogorov独立推导并于1941年发表。因此,该理论通常称为Wiener-Kolmogorov滤波理论。
传统上,滤波器是为实现所需的频率响应而设计的。但是,在维纳滤波器的情况下,与所需的无噪声信号的估计相比,它减少了信号中存在的噪声量。韦纳滤波器实际上是一个估计量。然而,在一篇重要的论文中,Levinson(1947)[参见参考文献6]表明,在离散时间内,整个理论可以减小到最小二乘,因此在数学上非常简单。参见参考文献4
因此,我们可以看到,韦纳的工作为估计问题提供了一种新方法。从使用最小二乘到另一种公认的过滤器理论的演进。但是,关键限制是维纳滤波器假定输入是固定的。可以说,卡尔曼滤波器是进化的下一步,它将放弃平稳的标准。在卡尔曼滤波器中,可以动态地调整状态空间模型以处理信号或系统的非平稳性质。
卡尔曼滤波器基于离散时域中的线性动态系统。因此,与维纳相反,它能够处理潜在的时变信号。由于Sorenson的论文在高斯最小二乘和卡尔曼滤波器之间画出了平行线,因此
...因此,人们看到高斯和卡尔曼的基本假设是相同的,只是后来允许状态从一次改变到下一次。差异引入了对高斯问题的非平凡修改,但可以在最小二乘框架内进行处理。
3.就预测的因果关系而言,它们是相同的;除了执行效率
有时会认为卡尔曼滤波器用于基于过去的数据预测未来事件,其中回归或最小二乘会在端到端进行平滑。这不是真的。读者应注意,这两个估计量(以及您可能想到的几乎所有估计量)都可以完成任何一项工作。您可以应用Kalman滤波器来应用Kalman平滑。
类似地,基于回归的模型也可以用于预测。给定训练向量,您应用并发现了另一个样本的模型参数,我们可以根据模型外推。
因此,两种方法都可以以平滑或拟合(非因果关系)的形式使用,也可以用于未来的预测(因果关系)。但是,关键的区别在于实现的意义重大。在多项式回归的情况下-需要重复整个过程,因此虽然可以实施因果估计,但计算量可能很大。[但是,我敢肯定,到目前为止,必须进行一些研究才能使事情反复进行]。
另一方面,卡尔曼滤波器本质上是递归的。因此,将其用于将来的预测(仅使用过去的数据)将非常有效。
这是另一个比较几种方法的不错的演示:参考5
参考文献
卡尔曼滤波器最佳入门-Dan Simon 卡尔曼滤波嵌入式系统编程2001年6月,第72页
HW Sorenson 最小二乘估计:从高斯到Kalman IEEE Spectrum,1970年7月。第63-68页。
列文森(1947)。“滤波器设计和预测中的维纳RMS误差标准。” J.数学 Phys。,第25卷,第261-278页。
差异非常大,因为它们是两个完全不同的模型,可以用来解决相同的问题。让我们快速回顾一下。
多项式回归是函数逼近的一种方式。我们具有形式的数据集,并希望确定函数关系,通常通过估计概率密度来表示该函数关系。在此为高斯的假设下,我们得到最小二乘解作为最大似然估计。
卡尔曼滤波是线性动力学系统中一种特殊的推理方法。LDS是状态空间模型的一种特殊情况,其中我们假设观察到的数据是通过对高斯随机变量上的马尔可夫链的后续步骤应用线性变换而生成的。因此,我们实际上要做的是对建模,这是一个时间序列的概率。卡尔曼滤波的过程然后是预测时间序列的下一个值,例如最大化。但是,可以使用相同的模型进行平滑,插值和更多操作。
因此:多项式回归可以进行函数逼近,卡尔曼滤波可以进行时间序列预测。两者完全不同,但是时间序列预测是函数逼近的特例。同样,两个模型都基于它们观察到的数据而有完全不同的假设。
卡尔曼滤波可为下一个状态提供多种预测,而回归无法外推。
卡尔曼滤波器还专注于包括噪声因子(基于高斯分布)。
已经说了很多,请允许我添加一些评论:
卡尔曼滤波器是贝叶斯概率理论的一种应用,这意味着可以(并且必须)指定“先验信息”或“先验不确定性”。据我了解,传统的最小二乘拟合并非如此。尽管可以使用LSQ拟合中的概率对观察值(数据)进行加权,但是不能轻易考虑解决方案的先验知识。
总而言之,KF找到的解决方案将取决于
a)提供“预测”的模型
b)作为“观测”的测量
c)预测和观测的不确定性
d)解决方案的先验知识。
“先验知识”被指定为初始猜测的方差,但在每个应用程序中都不相关或在不同程度上得到了利用。
如前所述,KF的常见用途是减少实时观测中的噪声。将观测值与模型预测值进行比较可以帮助估计无噪声的“真实测量值”。常见的应用就是将KF称为过滤器的原因。
在此示例中,最初的猜测将是假设从零时点开始的假设解,KF从该时间开始,具有相关的“先前不确定性”。通常,您会在预测模型中拥有一些未知的参数,但是这些参数可能受测量值的约束,即“可观察”。随着时间序列的移动,KF将改善对这些参数和“真实测量值”的估计。在那种情况下,通常将初始状态指定为仅产生一致的滤波性能:定义为实际估计误差在KF提供的解决方案的不确定性范围内。在该示例中,可以将初始状态的先前不确定性指定为较大,从而为KF提供纠正其包含的任何错误的机会。还可以指定较小的值,
KF设计的这一领域可能涉及反复试验或工程判断,以得出导致良好性能的初始状态及其不确定性的值。因此,KF滤波器设计的这方面和其他方面,包括指定不确定性以导致良好的性能(数值,估计,预测...),通常被称为“滤波器调整”。
但是在其他应用中,可以采用更严格和有用的方法来处理先前的不确定性。前面的示例是关于实时估计(从不确定的测量结果中滤除噪声)。初始状态及其方差(不确定性)几乎是尽早初始化滤波器的必要条件,此后,随着将来的观察结果用于改进估计,初始状态变得越来越不重要。现在考虑在特定时间t_s应用于测量和模型预测的卡尔曼滤波器。我们有不确定的观察结果,不确定的模型,但我们对要寻找的解决方案也有一些先验知识。假设我们知道其高斯PDF:均值和方差。在这种情况下,解决方案可能在很大程度上取决于先前的不确定性,即上面的d)项,
此功能是贝叶斯理论的基础,它使KF可以解决随机问题,同时考虑到通常可用的各种不确定性/信息。由于KF已经开发和应用了数十年,因此其基本功能并不总是得到详细描述。以我的经验,许多论文和书籍都专注于最优性和线性化(扩展KF,无味KF等)。但是,通过阅读介绍性文章和有关“粒子过滤器”的文章,我发现了对贝叶斯理论与KF之间联系的很好描述。这些是贝叶斯估计的另一种且最近的实现,如果您有兴趣,请查阅它们!