小波在基于时间序列的异常检测算法中的应用


25

我已经开始通过安德鲁·摩尔Andrew Moore)编写的《统计数据挖掘教程》来工作(强烈推荐给初次接触该领域的任何人)。我首先阅读了这份非常有趣的PDF,标题为“基于时间序列的异常检测算法简介”,其中Moore跟踪了创建算法以检测疾病暴发时使用的许多技术。在幻灯片的中间,第27页,他列出了许多其他用于检测爆发的“最新方法”。列出的第一个是小波。维基百科将小波描述为

振幅从零开始的波状振荡,先增大后减小,然后回零。通常可以将其可视化为“简短振荡”

但并未描述它们在统计学中的应用,我的Google搜索结果获得了学术论文,这些论文都假设小波如何与统计数据或该主题的完整书籍相关。

我希望对小波如何应用于时间序列异常检测有一个基本的了解,就像Moore在他的教程中说明其他技术一样。有人可以提供有关使用小波的检测方法如何工作的解释,或者可以提供有关此问题的可理解文章的链接吗?

Answers:


19

小波对于检测信号中的奇异点很有用(例如,请参见此处的论文(图3所示),以及本文中提到的参考文献。

这里的想法是,连续小波变换(CWT)具有沿频率传播的最大值线,即,线越长,奇异性越高。请参阅本文中的图3来了解我的意思!请注意,有与该论文相关的免费Matlab代码,应该在此处


此外,我可以为您提供一些启发式方法,详细说明为什么 DISCRETE(前面的示例是关于连续一个)小波变换(DWT对于统计学家来说很有趣(请问非穷举性):

  • 有各种各样的(现实(贝索夫空间)信号)通过小波变换被转换成稀疏序列。(压缩特性
  • 各种各样的(准平稳)过程,它们被转换成具有几乎不相关特征(去相关属性)的序列
  • 小波系数包含在时间和频率(不同比例)上局部化的信息。(多尺度属性)
  • 信号的小波系数集中在其奇异性上

19

您引用的演示文稿中的列表对我来说似乎相当武断,并且将使用的技术实际上取决于特定的问题。但是,您会注意到它还包括Kalman过滤器,因此我怀疑预期的用途是作为一种过滤技术。小波变换通常属于信号处理的主题,通常将被用作噪声非常大的数据的预处理步骤。一个例子就是Chen和Zhan 撰写的“ 多尺度异常检测 ”论文(见下文)。方法是对不同的频谱进行分析,而不是对原始的噪声序列进行分析。

小波通常与连续时间傅立叶变换进行比较,尽管它们具有在时间和频率上都可以定位的优势。小波既可以用于信号压缩,也可以用于平滑(小波收缩)。最终,在应用小波变换之后(例如,通过查看自相关函数),应用进一步的统计信息是有意义的。可用于异常检测的小波的另一方面是定位的影响:即,不连续只会影响附近的小波(与傅立叶变换不同)。此方法的一种应用是查找本地固定时间序列(使用LSW)。

如果您想进一步研究实际的统计应用,Guy Nason会推荐一本不错的书:“ 使用R进行统计的小波方法 ”。这是专门针对小波在统计分析中的应用,他提供了许多实际示例以及所有代码(使用wavethresh软件包)。纳森的书虽然确实做了提供一般概述的海军上将,但并未专门针对“异常检测”。

最后,维基百科文章确实提供了许多很好的入门参考,因此值得对其进行详细介绍。

[作为说明:如果您正在寻找一种好的现代技术来检测变更点,我建议您在花太多时间使用小波方法之前先尝试HMM,除非您有充分的理由在特定领域使用小波。这是基于我的个人经验。当然,可以考虑许多其他非线性模型,因此,这实际上取决于您的特定问题。]


1
我不清楚如何将隐马尔可夫模型用于异常检测,但是我非常想知道。我最不清楚的部分是如何创建具有有意义的转移概率的正确的基础状态机(除非只有两个状态,如“异常”和“非异常”,它们之间具有幼稚的转移概率)。
约翰·罗伯逊

6

最常用和实现的离散小波基函数(与Robin的答案中描述的CWT不同)具有两个很好的属性,这些属性使它们可用于异常检测:

  1. 他们得到了紧凑的支持。
  2. 它们充当带通滤波器,其通带取决于其支持程度。

实际上,这意味着您的离散小波分解将着眼于跨各种比例和频带的信号局部变化。如果您(例如)在一个函数上叠加了大幅度的高频噪声,而该函数在较长的时间内显示了一个低幅度的偏移,则小波变换将有效地将这两个比例分开,并让您看到基线偏移量,技术会错过;基线的变化可能暗示疾病爆发或其他一些利益变化。在很多方面,您可以将分解本身视为更平滑的方法(并且在非参数估计中对小波系数的有效收缩已经做了很多工作,例如,Donoho的关于小波的几乎所有内容)。与基于纯频率的方法不同,紧凑的支持意味着他们能够处理非平稳数据。与纯粹基于时间的方法不同,它们允许进行基于频率的过滤。

实际上,要检测异常或变化点,您可以对数据应用离散小波变换(可能是变体,称为“最大重叠DWT”或“平移不变DWT”,具体取决于您阅读的对象),并查看在较低频率的系数组中查看基线是否有明显变化。这将告诉您何时在任何日常噪音下发生长期变化。Percival和Walden(请参阅下面的参考资料)针对统计上显着的系数进行了一些检验,您可以使用这些检验来查看这种变化是否显着。

Percival和Walden,“时间序列分析的小波方法”,是出色的离散小波参考工作。很好的入门作品是Burrus,Gopinath和Guo撰写的“小波和小波变换入门,入门”。如果您来自工程背景,那么从信号处理的角度来看,“工程师和科学家的小波元素”是一个很好的介绍。

(已编辑,包括罗宾的评论)


通常,您提到的第一点是错误的,我建议您阅读Daubechie书中books.google.fr/…一章的第一句。此外,如果您已阅读我的答案,我已经在答案的第二部分中提到了DWT的漂亮属性……
robin girard 2010年

首先,你是对的。我应该说“最常用/实现的离散小波基函数”;我将进行编辑以反映这一点。第二点,您对某些CWT(最常见的是DOG小波或相关的Ricker小波;例如Gabor小波无法提供您描述的行为)如何检测奇异类型的异常给出了很好的答案。我试图给出一个类似的描述,说明如何将DWT用于检测其他种类的异常。
丰富

您提到的第二点也可能是错误的:小波支持(如果紧凑)提供的是关于小波的时间局部性而不是频率局部性的信息。
罗宾吉拉德

离散小波-或至少是已实现和常用的绝大多数-通常设计为在紧凑的支持约束下具有有用的基于频率的属性。例如,Daubechies的消失力矩条件或多或少等于通带的平坦度。小波的频率局部化特性通常导致系数成为稀疏表示,并允许在“信号+加法零均值噪声”假设下估计噪声方差。
丰富
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.