假设我有多个时间序列,例如某个地区各个站点的多个温度记录。我想获得整个区域的单个温度记录,可以用来描述区域气候的各个方面。直观的方法可能是简单地取每个时间步长上所有电台的平均值,但是我的统计蜘蛛感应(我肯定还不太了解)告诉我,这可能并不容易。尤其是,我认为对整个区域进行平均会消除一些有趣的极端温度,并且我可能会对附近站点之间的依赖性产生疑问。
如果我尝试这样的策略,还有其他方法可以克服这些问题,或者有更明智的组合此类数据的方法,还会遇到什么其他问题?
注意:答案可能比我提供的空间示例更为笼统。
1
问题可能出在“整个区域的单个温度记录”与您对区域内变化的任何兴趣之间的冲突。一个解决方案可能涉及解决这两个问题的某种方式,例如将方差划分为区域内和区域间组件。
—
彼得·埃利斯
@PeterEllis,是的,我隐约在想这个。出于这个问题的目的,让我们假设我不在乎区域内空间变异性。
—
naught101
在这种情况下,我认为您主要要担心的是相邻站点之间的依赖性。找到一种方法来减轻观测值的压力,这些观测值可以有效地复制隔壁的观测站,您应该可以。
—
彼得·埃利斯
@PeterEllis:好的,但是可能没有一种合理的物理方式做到这一点-车站的紧密联系并不一定意味着他们更加依赖-即。山脉相对两侧的两个近距离站点可能不像大平原上的两个远距离站点那么相似。是否有可靠的方法来统计定义依赖关系?我想,协方差...结果序列中的峰值仍然可能更少(我想这虽然反映了实际情况-宽阔区域的温度变化可能比单个地方的变化更慢更稳定)。
—
naught101 '04
@naught,关于您问题的空间方面,您的区域如何定义?在您的评论中,您提到山对面的两个近距离站点可能不同于大平原上的两个远距离站点。您是否考虑过根据邻近度和相似度重新定义测站区域?它们不一定必须与常规的区域边界匹配。相反,它们可以变成可以在传统地图上绘制的分析叠加层。
—
dav 2012年