Answers:
我完全不会触摸数据。将其用于与NaN的自相关:
“不接触数据”是指不删除任何数据或时间步长或将其替换为0或均值,这将损害有关特定时滞线性相关性的信息。如果您对“ SAMPLE”自相关感兴趣,我也将避免模拟间隙中的值,无论如何,即使最好的模拟技术也不会基于数据本身添加任何有关自相关的信息。我部分编码了matlab(上面的链接)自相关和部分自相关函数以处理NaN:计算中不包括NaN在内的任何数据对。这是针对每个滞后完成的。它为我工作。任何建议都可以接受。
有一些算法可以避免丢失值,因此首选解决方案是寻找它们(例如,acf
用于自相关的R )。
一般而言,方法是要么丢弃缺少观察值的数据(可能会非常痛苦),要么只是推算它们的值-邻居的均值对于平滑序列和小间隙可能就足够了,但是当然还有大量其他更强大的方法,包括样条,随机/最频繁值,模型插补等。