我目前在R中使用Twitter的AnomalyDetection:https : //github.com/twitter/AnomalyDetection。该算法为具有季节性的数据提供时间序列异常检测。
问题:是否有与此类似的其他算法(控制季节性无关紧要)?
我正在尝试在数据上为尽可能多的时间序列算法评分,以便我可以选择最佳的算法。
我目前在R中使用Twitter的AnomalyDetection:https : //github.com/twitter/AnomalyDetection。该算法为具有季节性的数据提供时间序列异常检测。
问题:是否有与此类似的其他算法(控制季节性无关紧要)?
我正在尝试在数据上为尽可能多的时间序列算法评分,以便我可以选择最佳的算法。
Answers:
Twitter算法基于
Rosner,B。,(1983年5月),“广义ESD多离群程序的百分比”,Technometrics,25(2),第165-172页
我敢肯定,自1983年以来,已经有了许多技术和进步!我已经对内部数据进行了测试,Twitter的异常检测未发现明显的异常值。我还将使用其他方法来测试时间序列中的异常值。我遇到的最好的是Tsay的异常检测程序,该程序在SAS / SPSS / Autobox和SCA软件中实现。所有这些都是商业系统。还有一个
tsoutliers软件包,它很棒,但是需要arima
模型规格才能有效地工作。auto.arima
在优化和模型选择方面,我的默认设置存在问题。
Tsay的文章是时间序列离群值检测的开创性工作。预测研究领域的领先期刊《国际预测杂志》提到,Tsay的文章是上面链接的文章中被引用次数最多,影响最大的论文之一(另请参见下文)。这项重要工作和其他异常检测算法在预测软件(尤其是开源软件)中的扩散非常罕见。
自2017年起,这是R中异常检测的选项。
anomalyDetection包(与Twitter的不同)
编辑2018
Autobox(我的公司)提供离群值检测。与Autobox相比,Twitter的算法具有较大的离群值,但错过了较小的离群值。
运行需要很长时间,但是结果对于发现较小的离群值以及季节性变化(离群值)也更好。下面是使用14,398个原始观测值的前8,560个观测值找到79个离群值的模型。标准版本max最多可以进行10,000次观测,但是可以对其进行更多修改,但是,当您要识别和应对异常值时,没有任何理由拥有大量数据。
Tsay在异常值,水平偏移和方差变化方面的工作以及Chow在参数变化方面的工作以及我们自己在检测季节性变化方面的工作,都对我们产生了影响
如果下载30天试用版并在Twitter示例数据中加载,并将频率指定为60,并将3个触发文件保存在安装文件夹中(noparcon.afs,novarcon.afs,notrend.afs),然后创建一个名为stepupde的文件。 AFS与100。