两个离散傅立叶变换的相似性?


14

在气候建模中,您正在寻找可以充分描绘地球气候的模型。这包括显示半周期性的模式:诸如厄尔尼诺南方涛动。但是模型验证通常发生在相对短的时间段内,那里有不错的观测数据(近150年)。这意味着您的模型可能会显示正确的模式,但是却是异相的,因此线性比较(如相关性)将无法证明模型运行良好。

离散傅里叶变换通常用于分析气候数据(这里是一个示例),以获取这种循环模式。是否有任何标准度量可以用作验证工具的两个DFT相似性(即模型的DFT与观察值的DFT之间的比较)?

取两个面积归一化DFT中最小值的整数(使用绝对实数值)是否有意义?我认为这将导致一个分数,其中X = 1x[0,1]x=1完全相同的模式,并且x=0完全不同的模式。这种方法的缺点是什么?


3
您是否考虑过使用相干性(从信号处理的角度,而不是统计的角度),一种跨谱测量?我不确定这是否是您要寻找的测量类型。
2012年

@jonsca:有趣的东西。我当然不是在寻找因果关系,但是我可以看到它可能有用。维基百科页面上的示例有些奇怪(为什么它不将气压作为模型变量?)。另外,我不确定90%的数字来自哪里...
naught101

这是个好问题。自上次阅读以来,该示例已添加到文章中。我怀疑这可能与以每天和每2天的频率为中心的一致性(因此与每天的潮汐现象有关)有关,但这只是一个猜测……
jonsca 2012年

(不过,我不知道他们是否可以整合以找到90%的比例)
jonsca 2012年

Answers:


12

频谱相干性(如果正确使用)可以做到。相干性是在每个频率下计算的,因此是一个向量。因此,加权相干之和将是一个很好的度量。通常,您需要在功率谱密度中具有高能量的频率处加权相干性。这样,当时间序列中该频率的内容可以忽略不计时,您将在主导时间序列的频率处测量相似度,而不是用较大的权重加权相干性。

因此,用简单的话来说-基本思想是找到信号中振幅(能量)较高的频率(解释为主要构成每个信号的频率),然后以较高的权重比较这些频率的相似性并以较低的权重比较其余频率的信号。

处理此类问题的区域称为互谱分析。 http://www.atmos.washington.edu/~dennis/552_Notes_6c.pdf是对交叉光谱分析的出色介绍。

最佳滞后:也在这里查看我的答案:如何将两个时间序列与可能的时差相关联

这利用频谱相干性找到最佳滞后。R具有计算功率谱密度,自相关和互相关,傅立叶变换和相干性的功能。您必须正确编写代码以找到最佳滞后时间以获得最大值。加权一致性。也就是说,还必须编写用于使用频谱密度加权相干矢量的代码。接下来,您可以对加权元素求和并求平均值,以获得在最佳滞后时观察到的相似性。


1
那是极好的资源!它很好地处理了假设检验,可以方便地避免很多有关连贯性的材料
jonsca 2012年

2

您是否尝试过其他方法来进行气候信号检测/建模,例如小波分析?实际上,您提到的是DFT在气候分析中可能引起的大问题:振荡不是完全周期性的,并且它们通常具有不同的时间跨度,因此它们实际上可能具有许多不同的振荡范围,这从傅立叶变换的角度来看非常令人困惑。 。

小波分析更适合于气候信号,因为它们使您可以检查不同的振荡时间跨度。就像乐器在不同的时间演奏不同的频率一样,您可以使用小波变换在不同的时间跨度中检查不同的频率。

如果您有兴趣,Lau&Weng(1995)的这篇论文应该消除您对这种方法的大部分疑问。最有趣的部分是,模型的小波变换与数据的小波变换几乎可以直接比较,因为您可以直接比较模型预测的时间跨度,而忽略了它没有的所有杂散振荡范围。

PS:我必须补充一点,我想将其发布为评论,因为这实际上并不是OP所要求的,但是我的评论可能太大了,因此决定将其发布为答案,可能会派上用场。 DFT的替代方法。


1

我投了赞成票,其次赞成使用基于小波和频谱图的分析来代替dft。如果您可以将序列分解为局部时频块,则可以减少非周期性和非平稳性的傅立叶问题,并且可以很好地比较离散数据以进行比较。

一旦将数据映射到频谱能量与时间和频率的三维集合,欧几里德距离就可以用来比较轮廓。完美的匹配将接近零的下限距离。*您可以研究时间序列数据挖掘和语音识别领域以寻找类似的方法。

*请注意,小波分箱过程将对信息内容进行某种程度的过滤-如果比较数据中没有丢失,则在时域中使用欧式距离进行比较可能更合适

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.