单变量点集中的正交多项式是在点上产生值的多项式,其点积和成对相关性为零。R可以产生具有函数poly的正交多项式。
相同的函数具有变式多项式,该变式在多变量点集上生成正交多项式。无论如何,所得的多项式在成对零相关的意义上是不正交的。实际上,由于一阶多项式应该只是原始变量,因此除非原始变量不相关,否则一阶多项式就不会是正交的。
然后,我的问题是:
- R中由polym计算的多元正交多项式是什么?它们只是单变量正交多项式的乘积吗?它们是用来干什么的?
- 可以存在真正的多元正交多项式吗?有没有简单的生产方法?在R中?它们实际用于回归吗?
更新资料
在回应Superpronker的评论时,我举一个例子说明不相关多项式的含义:
> x<-rnorm(10000)
> cor(cbind(poly(x,degree=3)))
1 2 3
1 1.000000e+00 -6.809725e-17 2.253577e-18
2 -6.809725e-17 1.000000e+00 -2.765115e-17
3 2.253577e-18 -2.765115e-17 1.000000e+00
多边形函数返回以点x评估的正交多项式(此处每个多项式为10,000点)。不同多项式上的值之间的相关性为零(存在一些数字误差)。
使用多元多项式时,相关性不为零:
> x<-rnorm(1000)
> y<-rnorm(1000)
> cor(cbind(polym(x,y,degree=2)))
1.0 2.0 0.1 1.1 0.2
1.0 1.000000e+00 2.351107e-17 2.803716e-02 -0.02838553 3.802363e-02
2.0 2.351107e-17 1.000000e+00 -1.899282e-02 0.10336693 -8.205039e-04
0.1 2.803716e-02 -1.899282e-02 1.000000e+00 0.05426440 5.974827e-17
1.1 -2.838553e-02 1.033669e-01 5.426440e-02 1.00000000 8.415630e-02
0.2 3.802363e-02 -8.205039e-04 5.974827e-17 0.08415630 1.000000e+00
因此,我不明白这些二元多项式在什么意义上是正交的。
更新2
我想弄清楚回归中使用的“正交多项式”的含义,因为在关联区间应用正交多项式的思想时,这种上下文可能会产生某种误导-就像上次Superpronker的评论一样。
我用R页101和102 引用朱利安·法拉威(Julian J.
正交多项式通过定义
等等,其中选择系数a,b,c ...使得当。z称为正交多项式。
通过稍微滥用语言,作者在这里将既用于多项式(作为函数),又用于多项式取集合的点的值的向量。也许根本就不是在滥用语言,因为自从本书开始以来,就是预测变量(例如,预测变量所取的一组值)。
正交多项式的含义实际上与区间上的正交多项式没有什么不同。我们可以在具有任何度量函数的任何可测量集合上以常规方式(使用积分)定义正交多项式。在这里,我们有一个有限集(),并且我们使用点积而不是整数,但是如果在我们的有限集的点上将度量函数用作狄拉克增量,那仍然是正交多项式。
并且关于相关性:中正交向量的点积(作为有限集合上正交向量的图像)。如果两个向量的点积为零,则协方差为零,如果协方差为零,则相关性为零。在线性模型的上下文中,将“正交”和“不相关”联系起来非常有用,例如“实验的正交设计”。