在拟合回归时是否有理由不使用正交多项式?


13

总的来说,我想知道在对具有高阶变量的回归进行拟合时是否最好不要使用正交多项式。特别是,我想知道使用R:

如果poly()raw = FALSE产生相同的拟合值作为poly()raw = TRUEpolyraw = FALSE解决了与多项式回归相关的问题,那么应该poly()raw = FALSE 始终被用于拟合多项式回归?在什么情况下最好不要使用poly()

Answers:


16

什么理由吗?当然; 可能几个。

例如,考虑一下,我对原始系数的值感兴趣(例如将它们与假设值进行比较),而共线性不是一个特殊的问题。我在通常的线性回归(线性正交多项式)中经常不指中心的原因几乎相同。

它们不是您不能通过正交多项式处理的事物。这更多是为了方便,但是方便是我做很多事情的重要原因。

也就是说,在许多情况下,我倾向于正交多项式,而对多项式进行拟合,因为它们确实有一些明显的好处。


是否可以将正交多项式回归所得的系数与假设值进行比较?
user2374133 2014年

2
是。例如,您可以将它们从“原始”多项式转换回隐含系数和标准误差。
Glen_b-恢复莫妮卡2014年

2
从正交多项式基到单项式基的转换通常是一个病态过程(对于高阶;低阶转换不是太糟糕),因此,如果先验对单项式基系数感兴趣,使用正交多项式获得的数值稳定性在转换时被排除在窗外,因此一开始最好也使用单项式。请注意,当然。
JM不是统计学家

1
@JM谢谢,这是一个很好的观点。幸运的是,如今在统计应用中很少会比一个相当低阶的多项式拟合得更好(我通常的建议是,除非有很强的理论上的理由要超过三或四级,否则应该考虑不同的方法-哪种选择视情况而定可能是最好的,但是像样条之类的东西可能适合某些情况。)
Glen_b-恢复莫妮卡的时间

13

因为如果您的模型在成长时离开R,则必须记住打包其居中和规范化常数,然后必须在整个过程中对它们进行定位。想象一下有一天将它硬编码到SQL中,并且意识到将其错放的恐怖!

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.