总的来说,我认为从提出一个更广泛而又不同的问题开始,从科学和统计学的角度来看,这是更加富有成果的,这是圆形预测器可以预测的响应程度。我在这里说的是圆形,而不是定向的,部分原因是后者包含了球形甚至更神话般的空间,这些空间不可能全部用一个答案覆盖。部分原因是因为你的例子,一天中的时间和一年的时间,都是圆形的。另一个主要的例子是指南针方向(与风,动物或人类的运动,路线等有关),它在许多圆形问题中都具有特征:实际上,对于某些科学家来说,这是一个更明显的起点。
只要您能摆脱它,在某种回归模型中使用时间的正弦和余弦函数是一种简单且易于实现的建模方法。这是许多生物学和/或环境实例的第一站。(这两种通常混为一谈,因为表现季节性的生物现象通常直接或间接地对气候或天气产生响应。)
具体来说,想象一下24小时或12个月内的时间测量结果,例如
罪[ 2 π(小时/ 24 )] ,cos [ 2 π(小时/ 24 )]
罪[ 2 π(月/ 12 )] ,cos [ 2 π(月/ 12 )]
每个描述整个一天或一年的一个周期。在测得的或计数的响应与某个循环时间之间不存在任何关系的形式化测试将成为标准测试,即在以正弦和余弦为预测因子,适当链接和家族的广义线性模型中,正弦和余弦系数是否共同为零根据响应的性质进行选择。
在这种方法中,响应的边际分布(正态或其他)的问题是次要的和/或由家庭选择来解决。
正弦和余弦的优点自然是它们是周期性的并自动环绕,因此每一天或每一年开始和结束时的值必须相同。边界条件没有问题,因为没有边界。
这种方法被称为圆形,周期,三角和傅里叶回归。有关一篇入门教程复习,请参见此处
在实践中,
每当我们期望出现季节性变化时,此类测试通常会在常规水平上显示出极其重要的结果。那么,更有趣的问题是估算的精确季节曲线,以及我们是否还需要使用其他正弦项的更复杂模型。
也没有什么可以排除其他预测因素,在这种情况下,我们只需要包含其他预测因素的更全面模型,例如季节性的正弦和余弦,以及其他所有因素的其他预测因素。
在某些时候,共同取决于数据,问题以及研究人员的品味和经验,强调问题的时间序列方面并建立具有明确时间依赖性的模型可能变得更加自然。确实,一些具有统计头脑的人会否认还有其他方法可以解决此问题。
容易被称为趋势(但并非总是如此容易识别)的是第2项或第3项,甚至是两者。
通常,与市场,国家和国际经济或其他人为现象的季节性有关的许多经济学家和其他社会科学家通常会对每天或(更常见的)每年内更复杂的可变性产生深刻的印象。通常(尽管并非总是如此),季节性是一种需要删除或调整的麻烦,而生物学和环境科学家则经常将季节性视为有趣且重要的,甚至是项目的主要重点。尽管如此,经济学家和其他人也经常采用回归型的做法也一样,但弹药指标(假人)变量的捆绑,最简单的年的每月变量或每季度0 ,1。这可能是尝试捕捉指定的假期,假期,学年的副作用等以及气候或天气原因的影响或冲击的实用方法。注意到这些差异后,以上大多数评论也适用于经济学和社会科学。
流行病学家和医学统计学家对发病率,死亡率,住院次数,诊所就诊等变化的态度和态度往往介于这两个极端之间。
在我看来,将天或年分成两半进行比较通常是任意的,人为的,并且最好是笨拙的。它还忽略了数据中通常存在的那种平滑结构。
编辑到目前为止,该帐户还没有解决离散时间和连续时间之间的区别,但是根据我的经验,我认为实践中没有什么大不了的。
但是准确的选择取决于数据的到达方式和变化方式。
如果数据是季度数据和人为数据,则我倾向于使用指标变量(例如,季度3和季度4通常不同)。如果是按月和按人计算,选择尚不明确,但是您必须努力将正弦和余弦出售给大多数经济学家。如果每月或更精细以及生物学或环境方面,则肯定是正弦和余弦。
编辑2有关三角回归的更多详细信息
三角回归的一个独特之处(如果愿意,可以用其他任何方式命名)是几乎总是将正弦和余弦项最好成对地呈现给模型。我们天的第一标尺时间,一年或罗盘方向,使得它被表示为圆上的角度的时间
弧度,因此在区间[ 0 ,2 π ]。然后,我们使用尽可能多的对罪ķ θ ,COS ķ θ ,ķ = 1 ,2 ,3 ,...θ[ 0 ,2个π]罪ķ θ ,COSķ θ ,ķ = 1 ,2 ,3 ,...根据模型的需要。(在循环统计中,三角惯例倾向于胜过统计惯例,因此希腊符号(例如用于变量和参数。)θ ,ϕ ,ψ
如果我们提供了对预测器如到回归状模型,那么我们有系数的估计,说b 1,b 2,为模型中的术语,即b 1个罪θ ,b 2 COS θ。这是一种适合相位以及周期信号幅度的方法。否则,可以将诸如sin (θ + ϕ )之类的函数重写为罪θ ,COSθb1个,b2b1个罪θ ,b2cosθ罪(θ + ϕ )
罪θ COSϕ + cosθ 罪φ ,
但是代表相位的和sin ϕ是在模型拟合中估算的。这样,我们避免了非线性估计问题。cosϕ罪ϕ
如果我们使用到圆形变化进行建模,然后自动将该曲线的最大值和最小值是半圈分开。对于生物学或环境变化,这通常是一个很好的近似值,但是相反地,我们可能还需要更多几个术语才能特别捕获经济季节性变化。这可能是改用指标变量的一个很好的理由,这立即导致对系数的简单解释。b1个罪θ + b2cosθ