在线性回归中使用循环预测变量


19

我正在尝试使用风速数据(0,359)和一天中的时间(0,23)拟合模型,但是我担心它们不能很好地拟合线性回归,因为它们本身不是线性参数。我想使用Python对其进行转换。我看到有人提到过至少在风速情况下通过取度的正弦和余弦来计算向量均值的方法,但不是很多。

有没有可能有用的Python库或相关方法?


1
谢谢您提出这个问题。请注意,询问代码或库是不合时宜的(您的大部分问题当然是随和的),因此此处的答案可能会或可能不会涉及到方面。
gung-恢复莫妮卡

此处的响应变量(结果,因变量)是什么?风向和一天中的时间都是预测因素吗?
尼克·考克斯

@NickCox是的,风向和一天中的时间都是预测因素。结果是代表颗粒浓度(空气污染)的整数值。还有其他一些预测变量,包括温度,湿度等,但是我认为这些变量不需要转换。
compguy24

1
我已经可以自由编辑标题了。在我看来,上一个标题“围绕圆的度的线性分布”根本没有捕捉到这个问题。
尼克·考克斯

Answers:


23

风向(此处以度为单位,大概是从北向顺时针方向的罗盘方向)是一个圆形变量。该试验是,规模的常规开始是一样的端部,即,。当作为预测变量时,最好将其映射为正弦和余弦。无论使用哪种软件,都可能期望以弧度为单位测量角度,因此转换将等于0=360

π 方向/180cosπ 方向/180

2π=360

π 时间/12cosπ 时间/12

要么

π时间+0.5/12cosπ时间+0.5/12

具体取决于如何记录或解释时间。

有时,自然或社会在强迫,对循环变量的依赖采取某种形式,该形式对于响应是最佳的,而相反的方向(半个圆圈)是最小的。在这种情况下,一个正弦和余弦项就足够了;对于更复杂的模式,您可能需要其他术语。欲了解更多信息,可在此处找到有关这种圆形,傅立叶,周期性,三角回归技术的教程,并依次提供其他参考。好消息是,一旦创建了正弦和余弦项,它们就只是回归中的额外预测变量。

有大量关于循环统计的文献,其本身被视为定向统计的一部分。奇怪的是,通常不会提及该技术,因为文献中的重点通常是循环响应变量。用向量的方式汇总循环变量是一种标准的描述性方法,但不是必需的,也不直接有助于回归。

有关术语的某些详细信息以统计术语表示的是风向和一天中的时间,而不是参数,无论您使用的科学领域如何。

ÿXββX[-1个1个]

附带说明对于诸如颗粒物浓度之类的响应变量,我希望使用带有对数链接的广义线性模型来确保肯定的预测。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.