我正在尝试使用风速数据(0,359)和一天中的时间(0,23)拟合模型,但是我担心它们不能很好地拟合线性回归,因为它们本身不是线性参数。我想使用Python对其进行转换。我看到有人提到过至少在风速情况下通过取度的正弦和余弦来计算向量均值的方法,但不是很多。
有没有可能有用的Python库或相关方法?
我正在尝试使用风速数据(0,359)和一天中的时间(0,23)拟合模型,但是我担心它们不能很好地拟合线性回归,因为它们本身不是线性参数。我想使用Python对其进行转换。我看到有人提到过至少在风速情况下通过取度的正弦和余弦来计算向量均值的方法,但不是很多。
有没有可能有用的Python库或相关方法?
Answers:
风向(此处以度为单位,大概是从北向顺时针方向的罗盘方向)是一个圆形变量。该试验是,规模的常规开始是一样的端部,即,。当作为预测变量时,最好将其映射为正弦和余弦。无论使用哪种软件,都可能期望以弧度为单位测量角度,因此转换将等于
要么
具体取决于如何记录或解释时间。
有时,自然或社会在强迫,对循环变量的依赖采取某种形式,该形式对于响应是最佳的,而相反的方向(半个圆圈)是最小的。在这种情况下,一个正弦和余弦项就足够了;对于更复杂的模式,您可能需要其他术语。欲了解更多信息,可在此处找到有关这种圆形,傅立叶,周期性,三角回归技术的教程,并依次提供其他参考。好消息是,一旦创建了正弦和余弦项,它们就只是回归中的额外预测变量。
有大量关于循环统计的文献,其本身被视为定向统计的一部分。奇怪的是,通常不会提及该技术,因为文献中的重点通常是循环响应变量。用向量的方式汇总循环变量是一种标准的描述性方法,但不是必需的,也不直接有助于回归。
有关术语的某些详细信息以统计术语表示的是风向和一天中的时间,而不是参数,无论您使用的科学领域如何。
附带说明对于诸如颗粒物浓度之类的响应变量,我希望使用带有对数链接的广义线性模型来确保肯定的预测。