我正在使用高斯过程(GP)进行回归。
在我的问题中,两个或多个数据点相对于长度彼此接近是很常见的问题的规模。此外,观察结果可能会非常嘈杂。为了加快计算速度并提高测量精度,只要我关心更大范围的预测,合并/积分彼此接近的点的群集就显得很自然。
我想知道什么是快速但半原则的方法。
如果两个数据点完全重叠,则,并且观察噪声(即似然性)是高斯分布,可能是异方差但已知,处理的自然方式似乎是将它们合并到一个数据点中:
,其中。
观测值是观测值平均值,以其相对精度加权:。
与观察相关的噪声等于:。
但是,如何合并两个相近但不重叠的点呢?
我认为应该仍然是两个位置的加权平均值,再次使用相对可靠性。理由是质量中心论证(即,将非常精确的观察视为一堆不太精确的观察)。
对于与上述公式相同。
对于与观测相关的噪声,我想知道是否除了上面的公式之外,还应该在噪声中添加一个校正项,因为我正在移动数据点。本质上,我会得到与和有关的不确定性增加(分别是信号方差和协方差函数的长度尺度)。我不确定这个术语的形式,但是在给定协方差函数的情况下,我对如何计算它有一些初步的想法。
在继续之前,我想知道那里是否已经有东西。如果这似乎是明智的处理方法,或者有更好的快速方法。
我在文献中能找到的最接近的东西是这篇论文:E. Snelson和Z. Ghahramani,使用伪输入的稀疏高斯过程,NIPS '05;但是(相对)涉及到他们的方法,需要进行优化才能找到伪输入。