我正在处理大量加速度计数据,这些数据是由许多对象佩戴的多个传感器收集的。不幸的是,这里似乎没有人知道设备的技术规格,而且我认为它们从未进行过校准。我没有关于设备的大量信息。我正在研究硕士学位论文,加速度计是从另一所大学借来的,所以情况有点不透明。那么,在设备上进行预处理?没有线索。
我所知道的是它们是具有20Hz采样率的三轴加速度计。数字的,大概是MEMS。我对非语言行为和手势感兴趣,根据我的消息来源,这些行为和手势通常会在0.3-3.5Hz的范围内产生活动。
规范化数据似乎很有必要,但是我不确定该使用什么。数据的很大一部分接近于其余值(从重力开始,原始值约为1000),但有些极端,例如某些日志中的最大值为8000,而另一些日志中的最大值为29000。请参见下图。我认为用max或stdev进行归一化是一个坏主意。
在这种情况下,通常的做法是什么?除以中位数?百分位数值?还有吗
作为附带问题,我也不确定是否应该限制极端值。
感谢您的任何建议!
编辑:这是大约16分钟的数据(20000个样本)的图表,可让您大致了解数据的分布方式。