我正在研究一种算法,该算法将从多个传感器流中获取最新数据点的向量,并将欧几里德距离与以前的向量进行比较。问题在于,不同的数据流来自完全不同的传感器,因此采用简单的欧几里德距离将大大过分强调某些值。显然,我需要某种方式来规范化数据。但是,由于该算法是设计为实时运行的,因此在规范化过程中,我无法整体使用有关任何数据流的任何信息。到目前为止,我一直在跟踪每个传感器在启动阶段看到的最大值(前500个数据向量),然后将来自该传感器的所有将来数据除以该值。这工作出奇地好,但是感觉很不雅致。
我并没有为找到一个预先存在的算法而感到幸运,但是也许我只是没有在正确的地方寻找。有人知道吗?或有什么想法?我看到一个建议使用移动平均值(可能是由Wellford的算法计算得出的),但是如果我这样做了,那么相同值的多个读数将不会显示为相同,这似乎是一个很大的问题,除非我缺少一些东西。任何想法表示赞赏!谢谢!