时间序列分析的重点是什么?


29

时间序列分析的重点是什么?

还有很多其他统计方法,例如回归和机器学习,它们都有明显的用例:回归可以提供有关两个变量之间关系的信息,而机器学习非常适合预测。

但是与此同时,我看不到时间序列分析有什么用。当然,我可以拟合ARIMA模型并将其用于预测,但是当该预测的置信区间将很大时,这有什么好处呢?尽管这是世界历史上数据驱动最多的行业,但没有人能预测股市是有原因的。

同样,如何使用它来进一步了解我的流程?当然,我可以绘制ACF并进行“啊哈!有一些依赖!”,那又如何呢?重点是什么?当然存在依赖性,这就是为什么要开始进行时间序列分析的原因。您已经知道存在依赖性。但是您打算将其用于什么?


13
除了财务和经济学之外,还有其他一些用例可以很好地发挥作用。
user2974951

29
您也无法使用其他统计和机器学习方法来预测股市,这是否也使它们无用..?
蒂姆

16
您似乎暗示ARIMA不是回归形式。它是。
Firebug

10
我认为这是一个好问题,即使答案对专家来说似乎很明显。
gung-恢复莫妮卡

6
我希望与@gung和其他人有所不同,因为最少的研究工作就能回答它。
ub

Answers:


54

一种主要用途是。我已经通过预测一家超市明天出售某种产品​​的多少单位来养活我的家人十多年了,以便他可以订购足够的库存,但不要太多。这有钱。

其他预测用例在《International Journal of Forecasting or Foresight》等出版物中也有介绍。(完整披露:我是Foresight的副编辑。)

是的,有时候很大。(我假设您的意思是PI,而不是有区别。)这仅表示该过程难以预测。然后,您需要减轻压力。在预测超市销售时,这意味着您需要大量的安全库存。在预测海平面上升时,这意味着您需要建造更高的堤岸。我想说,较大的预测间隔确实可以提供有用的信息。

对于所有预测用例,分析都是有用的,尽管预测是一个更大的主题。您通常可以通过考虑时间序列中的依赖性来改善预测,因此您需要通过分析来了解它们,这种分析比仅知道那里的依赖性更为具体。

另外,即使他们没有预测,人们也会对时间序列感兴趣。计量经济学家喜欢发现宏观经济时间序列中的变化点。或评估干预措施(例如税法变更)对GDP或其他方面的影响。您可能想浏览一下自己喜欢的计量经济学期刊,以获得更多启发。


14
+1。它在其他地方也很有用。进行时间序列分析肯定会使您警觉到影响您感兴趣的结果的事件(您不知道)。我和我的所有同事都被惊呆了,发现我们通常在星期二上午对产品化学分析的表现还很差。我们将其追溯到精心计划的清洁计划,该计划存在一些缺陷。一年来,我们节省了将近一百万美元,并将产品ppk从1.7提高到1.9。获得的经验教训:始终对任何带有变异框架的问题进行基本的时间序列分析。
斯蒂安·伊特维克

+1。@Stephan Kolassa,您的回答将突出显示在现实世界中如何使用预测,这是我对OP问题的解释。预测间隔点和(半)长度正是您计划缓解策略所关心的信息。如果您正在建造堤防以防止曼哈顿洪水泛滥,并且您的新时间序列方法充分缩短了预测间隔,则可以仅使用必要的资源来减少堤防建设成本。比照适用于您的杂货店示例。
卢卡斯·罗伯茨

13

M. Dettling的幻灯片上的TS分析目标:

1)探索性分析:系列属性的可视化

  • 时间序列图
  • 分解成趋势/季节模式/随机误差
  • 用于了解依赖关系结构的相关图

2)建模:将随机模型拟合到表示和反映该系列最重要属性的数据

  • 探索性完成或具有先验知识
  • 模型选择和参数估计至关重要
  • 推论:模型对数据的拟合程度如何?

3)预测:使用不确定性度量来预测未来的观测结果

  • 主要基于模型,使用依赖关系和过去的数据
  • 是外推法,因此通常要加一点盐
  • 类似于通过后视镜驾驶汽车

4)过程控制:(物理)过程的输出定义了一个时间序列

  • 将随机模型拟合到观测数据
  • 这可以理解信号和噪声
  • 监视正常/异常波动是可行的

5)时间序列回归:使用1个或多个输入序列建模响应时间序列在iid误差假设下拟合此模型:

  • 导致无偏估计,但是...
  • 通常严重错误的标准错误
  • 因此,置信区间和检验会产生误导

关于库存标记的问题:

  • 这些TS易变,很难建模。
  • 例如,与公司有关的法律变更可能导致TS流程的变更...任何统计工具如何预测呢?

关于序列相关:

  • 与多元统计量相比,时间序列中的数据通常不是iid,而是串行相关的。
  • 此信息也可以用于检测不应该被识别的东西,例如肮脏的实验室仪器

1
我会添加分类,例如,有很多应用程序可以通过分析手机的加速度计数据来识别您的活动。
SaiBot

那很有意思!你怎么做到这一点?
妮可·折纸

1
我认为有很多不同的方法。一种方法是让用户通过标记其活动来生成训练数据。一旦有了,就可以减少(重叠)时间间隔(例如3秒)的时间序列,并训练机器学习模型。之后,您将能够对未标记的活动进行分类。
SaiBot

谢谢SaiBot。我知道,我不得不更频繁地考虑使用不同工具的组合:)
Nicole Origami Fox

11

回答问题的最简单方法是了解数据集通常分为横断面时间序列面板横截面回归是横截面数据集的首选工具。这就是大多数人所知道的术语“ 回归”。有时将时间序列回归应用于时间序列,但是时间序列分析除了回归之外还具有广泛的工具。

X1个ÿ1个X2ÿ3XñÿñX一世ÿ一世ÿXÿ^X

在此处输入图片说明

如果样本不是随机的,则回归可能根本不起作用。例如,您只选择了一年级的女孩来估算模型,但必须预测12年级男生的身高。因此,即使在横截面设置中,回归也有其自身的问题。

XŤÿŤX1个ÿ1个X2ÿ3XñÿñŤXÿ

在此处输入图片说明

Ť

第三种常见的数据集类型是面板,尤其是第一种纵向数据。在这里,您可能会为许多学生获得一些体重和身高变量的快照。该数据集可能看起来像横截面或一组时间序列。

在此处输入图片说明

自然,这可能比前两种类型更复杂。在这里,我们使用面板回归和为面板开发的其他特殊技术。

总而言之,与横截面回归相比,时间序列回归被认为是一种独特的工具,是因为时间序列在回归技术的独立性假设方面提出了独特的挑战。特别是,由于与横截面分析不同,观察顺序很重要,因此通常会导致各种相关性和依存关系结构,这有时会使回归技术的应用无效。您必须处理依赖性,而这正是时间序列分析所擅长的。

资产价格的可预测性

另外,您在重复关于股票市场和资产价格的普遍误解,即无法预测它们。这种说法太笼统了,以至于不正确。的确,您不能完全可靠地预测AAPL的下一个波动。但是,这是一个非常狭窄的问题。如果您扩大网络覆盖范围,则会发现很多用于各种预测(尤其是时间序列分析)的赚钱机会。统计套利就是这样一种领域。

现在,难以在短期内预测资产价格的原因是由于价格变化的很大一部分是新信息。从定义上说,无法根据现实情况设计出的真正新信息是无法预测的。但是,这是一个理想化的模型,许多人会认为存在允许状态持续存在的异常情况。这意味着价格变化的部分可以由过去解释。在这种情况下,时间序列分析非常适合,因为它可以精确地处理持久性。它把新与旧区分开来,新的是无法预测的,但是旧的却从过去拖到了未来。如果您能解释一点,在财务上意味着您可以能够赚钱。只要基于这种预测的策略的价格能够涵盖其产生的收入。

最后,看看2013年的诺贝尔经济学:“很有可能预见到这些价格在较长时期内(如未来三到五年)的广泛走势。” 看一下席勒的诺贝尔奖演讲,他讨论了资产价格的可预测性。


6

时间序列分析还可以有助于在时间数据中进行有效的异常或异常检测。

例如,可以拟合ARIMA模型并计算预测间隔。根据使用情况,可以使用时间间隔来设置阈值,在该阈值之内可以说该过程处于受控状态。如果新数据超出阈值,则将其标记为进一步关注。

这篇博客文章简要概述了时间序列分析,以进行离群值检测。为了进行更深入的处理,ebay的研究人员根据时间序列数据的统计分析解释了他们如何进行大规模的异常检测。


6

还有很多其他统计方法,例如回归和机器学习,它们都有明显的用例:回归可以提供有关两个变量之间关系的信息,而机器学习非常适合预测。

您在下面回答自己的问题:自相关。时间序列通常具有它,这违反了基本OLS回归的假设。时间序列技术对时间序列具有适当的假设。

处理序列数据的机器学习方法是专门的,例如递归神经网络(RNN)或一维卷积神经网络(CNN),因此您仍然拥有用于时间序列的专门技术。

但是与此同时,我看不到时间序列分析有什么用。当然,我可以拟合ARIMA模型并将其用于预测,但是当该预测的置信区间将很大时,这有什么好处呢?尽管这是世界历史上数据驱动最多的行业,但没有人能预测股市是有原因的。

时间序列技术产生的置信区间(CI)可能会比非时间序列回归产生的置信区间大。此功能称为准确功能。通常,当您使用非时间序列回归时,您的配置项会更小,但它是不正确的,因为您违反了其假设。如果您只想显示一个带有小的CI的图形,则可以组成它们或完全跳过该CI,但是如果您想要适当的CI,请使用适当的技术。

由于其性质,很难预测股市。其他时间序列更可预测。在股票市场上尝试使用您选择的机器学习技术,我怀疑您会获得更大的成功。

同样,如何使用它来进一步了解我的流程?当然,我可以绘制ACF并进行“啊哈!有些依赖!”,那又如何呢?重点是什么?当然存在依赖性,这就是为什么要开始进行时间序列分析的原因。您已经知道存在依赖性。但是您打算将其用于什么?

进行预测。看季节性。了解不同季节数据的可变性。更不用说还有比传统ARIMA更强大的时间序列技术,例如State Space方法。ARIMA不是对时间序列建模的最佳技术。(实际上,您选择的统计软件中的ARIMA程序可能在后台使用状态空间表示。)


5

为了为redhqs的异常检测答案添加一些颜色,在工作中,我为销售和流量等运营指标建立了异常检测模型。我们进行时间序列分析,以了解如果一切都按预期进行,那么销售额应该是多少,然后将其与观察值进行比较,以查看网站是否损坏。这很重要,因为该站点每停机一分钟,我们就会损失很多钱。

您可以使用不同的方法,并且在许多情况下,不同的方法会尝试完成不同的事情。例如,我用于销售异常检测的主要统计方法称为“ STL”(使用黄土的季节趋势分解)。这将常规的季节性,趋势和随机噪声分开。我们实际上使用它来识别每日和每周的季节性。然后我们排除噪音,并结合趋势/季节性来估计预期的销售量。因此,在我们的案例中,我们使用这种方法来了解销售额随一天中的时间和一周中的时间而变化,并从估计中排除随机噪声。


似乎您建立的时间序列模型假定没有异常,因此与明确允许同时识别SARIMA prtion和等待发现的干预结构(脉冲,水平/步移)的模型识别策略相比,可能不那么健壮,季节脉动,当地时间趋势)
IrishStat

STL算法具有健壮性标志(它控制平滑循环的迭代次数)。无论如何,它对于我们的时间序列非常有效。
威利·惠勒

如果存在等待发现的确定性结构,则迭代次数不会处理模型形式的偏差。
IrishStat

3

除了其他人提供的出色答案外,我想评论一下在电气工程中如何使用时间序列分析。

电气工程的很大一部分包括调制电压和电流以传输信息,或者使用传感器将物理信号(例如声波)转换为电子形式,希望计算机可以据此做出决定。模数(A / D)转换器将这些信号转换为一组均匀分布的(按时间)离散样本或时间序列!时间序列分析方法是几乎所有现代信号处理算法的基础。

例如,语音处理包括使用麦克风将声波转换为由A / D采样的电压,然后创建信号的时间序列模型。例如,手机中的线性预测编码器(LPC)会创建一个正在说出的单词的ARMA模型,并传输模型系数(以及代表来自预定义词典的激励信号的索引)来代替数据样本本身来实现数据压缩。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.