术语“时间序列分析”和“纵向数据分析”之间有什么区别


17

在谈论纵向数据时,我们可能会重复引用从同一主题/研究单位随时间收集的数据,因此,同一主题内的观察存在相关性,即主题内相似度。

在谈论时间序列数据时,我们还引用了一系列时间收集的数据,这似乎与上述纵向设置非常相似。

我想知道是否有人可以在这两个术语之间提供清晰的说明,它们之间的关系是什么,区别是什么?


1
这可能会变成一个民意测验...我处理过两种类型的数据,一个主要区别似乎是纵向数据经常用于因果分析中,以了解干预措施或治疗的影响,而时间序列则经常使用在预测中。当然,两者之间的区别不是很明确的(您需要了解要预测的潜在驱动因素,而IMO除非能够很好地进行预测,否则您就不了解这些驱动因素)。但是按时间序列进行信号检测的人通常不太关心预测,因此他们可能会拒绝我的区分。
S. Kolassa-恢复莫妮卡2014年

感谢您的意见。但是我认为“因果关系”一词在这里可能不合适,而“联系”一词应该更好?就数据分析的目的而言,我认为您的评论对我有一定意义。但是我们不能使用纵向数据进行预测吗?由于它也是一种时间序列数据。
askming

1
您确实有一个关于“因果关系”与“关联关系”的观点,并且当然可以使用纵向数据进行预测-只是我不经常同时看到这两个概念。预报员通常谈论时间序列。除此之外,我不能说它比@gung好。
S. Kolassa-恢复莫妮卡2014年

3
一种可能的典型(非定义性)差异是,您在时间序列中看到并建模了时间响应,并依赖于状态;这是残留效应。在纵向时间分析中,通常将时间视为永久的,进化的背景因素。ŤŤ-1个
ttnphns 2014年

Answers:


19

我怀疑是否有严格的,正式的定义会被广泛的数据分析师所接受。

但是,一般而言,时间序列表示在很长一段时间内定期观察到的单个研究单位。一个典型的例子就是一个国家几十年甚至一百多年的年GDP增​​长。对于在私人公司工作的分析师来说,这可能是整个公司生命周期内的每月销售收入。由于观察到的信息太多,因此需要对数据进行详细分析,以查找不同时期的季节性(例如每月:在支付薪水后的一个月初会有更多销售;每年:11月和之后有更多销售) 12月,人们在圣诞节购物),政权可能发生变化。正如@StephanKolassa指出的那样,预测通常非常重要。

纵向通常是指在大量研究单位中进行的测量较少。一个典型的例子是药物试验,其中有数百名患者在基线(治疗前)进行测量,接下来三个月每月进行一次测量。在此示例中,每个单元只有4个观测值,因此无法尝试检测时间序列分析人员感兴趣的特征。另一方面,假定患者被随机分配到治疗和对照组中,则可以推断出因果关系非独立性已得到解决。如此暗示,通常将非独立视为令人讨厌的事情,而不是关注的主要特征。


8

大约有三种数据集:

  • 横截面:同时不同的主题;认为它是一行,有许多列对应于不同的主题;
  • 时间序列:同一主题在不同时间;认为它是一列,行对应于不同的时间点;
  • 面板(纵向):不同时间的多个主题,您在不同的时间具有相同的主题,并且您同时具有多个主题;可以将其视为一张表格,其中行是时间点,列是主题。

2
根据您的评论,纵向数据似乎是从不同主题收集的一组多个时间序列数据?
2014年

1
通常,是的,您可以将每个主题的数据视为时间序列。但是实际上,纵向数据对于每个主题通常只有很少的时间点。他们称时间点为波浪。例如,可能是医学研究,每个患者每月间隔进行4-5次观察,并且在过去的几年中有数百名患者。这样,面板数据集通常是不平衡的(认为​​表格非常稀疏),因此纵向研究有自己喜欢的方法来处理此问题。
Aksakal 2014年

考虑到这个问题,这很有帮助,但是还有许多其他种类的数据集不属于这些标题。但是,它们似乎与问题无关,因此尝试对每种可能的数据集进行分类都是徒劳的。示例:基本结构为subject x subject的任何数据集;不是二维的任何数据集。
Nick Cox 2014年

@NickCox,是的,但是我从事计量经济学,这三个都是理论发达的,并且大多在我们的领域中使用
Aksakal 2014年

2
毫无疑问,您是,但该问题中没有任何内容强制或鼓励狭义的计量经济学观点,您的具体观点也未明确。
Nick Cox 2014年

3

这两个术语可能与OP假设的方式无关-即,我认为它们不是竞争性的分析模式。

相反,时间序列分析描述了一组较低级别的技术,这些技术可能对纵向研究中的数据分析有用。

时间序列分析的研究对象是一些与时间有关的信号。

分析和建模/预测这些与时间有关的信号的大多数技术都是在这些信号可分解为各种分量的前提下构建的。最重要的两个是:

  • 周期性成分(例如,每天,每周,每月,季节性);和

  • 趋势

换句话说,时间序列分析基于利用时间相关信号的循环特性来提取基础信号。


0

为简单起见,我假设对个人进行研究,但对任何分析单位也是如此。并不复杂,时间序列是随时间收集的数据,通常意味着在不同的时间间隔从等效总体中进行相同的测量-或连续收集但以定时间隔进行分析。
纵向数据范围更广。相同的种群将替换为相同的种群,因此各个数据可以随时间进行配对或合并。纵向数据可以重复测量,也可以不重复,这取决于研究的目标。当纵向数据看起来像一个时间序列时,就是我们随时间测量同一件事。最大的区别在于,在一个时间序列中,我们可以测量整个时间(或按组)测量的总体变化,而在纵向分析中,您实际上可以测量各个级别的变化。因此,您具有更大的分析潜力,并且如果涉及抽样,变化的度量也将没有错误,因此纵向研究可以更精确,更有意义。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.