动态时间规整和规范化


9

我正在使用动态时间规整来匹配“查询”和“模板”曲线,到目前为止取得了一定的成功,但是我有一些基本问题:

  1. 我正在通过评估DTW结果是否小于我启发式得出的某个阈值来评估“匹配”。这是使用DTW确定“匹配”的一般方法吗?如果没有,请说明...

    假设(1)的答案是“是”,那么我感到困惑,因为DTW结果对a)曲线幅度的差异和b)查询向量的长度以及“模板”矢量。

    我正在使用对称步长函数,因此对于(b),我通过除以M + N(DTW矩阵的宽度+高度)来归一化我的DTW结果。这似乎有些有效,但是似乎会惩罚距离对角线更远的DTW匹配(即,通过DTW矩阵的路径更长)。对于“规范化”方法来说,这似乎是任意的。除以通过矩阵的步数似乎有直觉的意义,但根据文献,这似乎并不是解决问题的方法。

  2. 那么,是否有更好的方法来针对查询和模板矢量的大小调整DTW结果?

  3. 最后,如何针对查询和模板向量之间的幅度差异归一化DTW结果?

实际上,由于缺乏可靠的归一化技术(或我缺乏理解),在处理样本数据以识别用于定义“匹配”的最佳阈值水平时,似乎需要大量的人工工作。我想念什么吗?

Answers:


8

至少据我所知,没有“通用方法”。此外,无论如何,您都试图最小化距离度量。例如,在DTW论文的祖父中,Sakoe&Chiba(1978)使用作为两个特征向量之间差异的度量。||aibi||

正确识别后,通常需要有相同数量的点才能正常工作。我建议在您的曲线上使用lowess()平滑器/插值器,以使其首先具有相同的大小。这是“曲线统计”的相当标准的东西。您可以在Chiou等人的文章中看到一个示例应用程序(2003);作者并不在乎这项工作中的DTW,但如何处理大小不等的读数是一个很好的范例。

另外,正如您所说,“振幅”是一个问题。说实话,这有点开放。您可以尝试像Zhang和Mueller(2011)提出的那样的曲线下面积方法来解决这个问题,但实际上是为了时间扭曲甚至规范范数归一化(即用替换。可以按照Tang和Mueller(2009)的论文中的方法进行我将紧随,但无论如何,因为您还注意到样本的归一化是必要性。f(x)f(x)supy|f(x)|

根据数据的性质,您可以找到更多特定于应用程序的文献。我个人发现,相对于目标成对翘曲函数最小化的方法是最直观的。因此要最小化的目标函数为: ,尽管很复杂,但实际上整个过程非常简单:您试图找到翘曲函数,该函数使翘曲查询曲线与参考曲线(项gCλ(Yi,Yk,g)=E{T(Yi(g(t))Yk(t))2+λ(g(t)t)2dt|Yi,Yk}gYi(g(t))Yk(t)Yi(g(t))Yk(t))对您通过该扭曲施加的时间失真(术语)进行某种归一化处理。这就是MATLAB包PACE所实现的。我知道JO Ramsay等人存在R包fda。这可能也有帮助,但是我还没有亲自使用它(令人讨厌的是,该程序包方法的标准参考在许多情况下是Ramsay和Silverman的出色著作《Functional Data Analysis(2006)2nd ed。》,您必须搜寻400页的书可以帮助您找到所需的内容;至少无论如何,它都是不错的阅读方法)g(t)t

您在统计学文献中描述的问题被广泛称为“ 曲线配准 ”(例如,对该问题的早期处理,请参见Gasser和Kneip(1995)),并且属于功能数据分析技术的一般范畴

(如果我可以在线找到原始论文,则链接会直接链接到该文档;否则,链接会指向一个通用的数字图书馆。几乎所有提到的论文都可以免费起草。我删除了原评论,因为它是被此职位取代。)


这是一个很好的非常有用的答案。这些参考特别有用。
Mikko

您是否知道在dtw中说明“振幅是问题”的合适参考?这可能是如此明显,以至于我很难找到一个参考资料,对此进行了清晰的讨论。
Mikko

我很高兴你喜欢。正如我所说,对振幅的处理“有点开放”,除非您与所讨论的应用程序或方法有关(例如在Zhang&Mueller的著作中, 09)。当您以不同单位测量数据时,必须进行标准化。通常至关重要的是功能主体/规范/ what_have_you组件的规范化,因此它们构成的基础。L2
usεr11852

从已经提到的资源中,您最好的选择可能是Chapt的Ramsay&Silverman撰写的FDA书籍。关于“功能数据的注册和显示”,请参见图7。Horváth和Kokoszka所著的《使用应用程序进行功能数据的推理》一书也非常有用。第三部分“从属功能数据”涉及规范化问题,主要是因为人们关心变化点检测。
usεr11852
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.