在谈论纵向数据时,我们可能会重复引用从同一主题/研究单位随时间收集的数据,因此,同一主题内的观察存在相关性,即主题内相似度。
在谈论时间序列数据时,我们还引用了一系列时间收集的数据,这似乎与上述纵向设置非常相似。
我想知道是否有人可以在这两个术语之间提供清晰的说明,它们之间的关系是什么,区别是什么?
在谈论纵向数据时,我们可能会重复引用从同一主题/研究单位随时间收集的数据,因此,同一主题内的观察存在相关性,即主题内相似度。
在谈论时间序列数据时,我们还引用了一系列时间收集的数据,这似乎与上述纵向设置非常相似。
我想知道是否有人可以在这两个术语之间提供清晰的说明,它们之间的关系是什么,区别是什么?
Answers:
我怀疑是否有严格的,正式的定义会被广泛的数据分析师所接受。
但是,一般而言,时间序列表示在很长一段时间内定期观察到的单个研究单位。一个典型的例子就是一个国家几十年甚至一百多年的年GDP增长。对于在私人公司工作的分析师来说,这可能是整个公司生命周期内的每月销售收入。由于观察到的信息太多,因此需要对数据进行详细分析,以查找不同时期的季节性(例如每月:在支付薪水后的一个月初会有更多销售;每年:11月和之后有更多销售) 12月,人们在圣诞节购物),政权可能发生变化。正如@StephanKolassa指出的那样,预测通常非常重要。
纵向通常是指在大量研究单位中进行的测量较少。一个典型的例子是药物试验,其中有数百名患者在基线(治疗前)进行测量,接下来三个月每月进行一次测量。在此示例中,每个单元只有4个观测值,因此无法尝试检测时间序列分析人员感兴趣的特征。另一方面,假定患者被随机分配到治疗和对照组中,则可以推断出因果关系非独立性已得到解决。如此暗示,通常将非独立视为令人讨厌的事情,而不是关注的主要特征。
大约有三种数据集:
为简单起见,我假设对个人进行研究,但对任何分析单位也是如此。并不复杂,时间序列是随时间收集的数据,通常意味着在不同的时间间隔从等效总体中进行相同的测量-或连续收集但以定时间隔进行分析。
纵向数据范围更广。相同的种群将替换为相同的种群,因此各个数据可以随时间进行配对或合并。纵向数据可以重复测量,也可以不重复,这取决于研究的目标。当纵向数据看起来像一个时间序列时,就是我们随时间测量同一件事。最大的区别在于,在一个时间序列中,我们可以测量整个时间(或按组)测量的总体变化,而在纵向分析中,您实际上可以测量各个级别的变化。因此,您具有更大的分析潜力,并且如果涉及抽样,变化的度量也将没有错误,因此纵向研究可以更精确,更有意义。