Questions tagged «polynomial»

w /> 1项的数学表达式包含相同的变量(例如x&x ^ 2)。多项式通常用于建模曲线关系。

2
回归中的B样条VS高阶多项式
我没有特定的示例或任务。我只是使用b样条的新手,我想在回归上下文中更好地了解此函数。 假设我们要评估响应变量与某些预测变量x 1,x 2,...之间的关系。。。,X p。预测变量包括一些数值变量和一些分类变量。yyyx1,x2,...,xpx1,x2,...,xpx_1, x_2,...,x_p 假设在拟合回归模型后,数值变量之一(例如是有效的。之后的逻辑步骤是评估是否需要更高阶的多项式,例如:x 2 1和x 3 1,以便在不过度拟合的情况下充分说明该关系。x1x1x_1x21x12x_1^2x31x13x_1^3 我的问题是: 在什么时候选择b样条曲线或简单的高阶多项式。例如在R: y ~ poly(x1,3) + x2 + x3 与 y ~ bs(x1,3) + x2 + x3 您如何使用图来告知您在这两者之间的选择,以及从图上还不清楚时会发生什么情况(例如:由于大量数据点) 您将如何评估和x 3之间的双向交互作用项x2x2x_2x3x3x_3 对于不同类型的模型,上述变化如何 您是否会考虑从不使用高阶多项式并始终拟合b样条并惩罚高灵活性?

1
为什么对于人工多项式展开和使用R`poly`函数会得到不同的预测?
为什么对于人工多项式展开和使用R poly函数会得到不同的预测? set.seed(0) x <- rnorm(10) y <- runif(10) plot(x,y,ylim=c(-0.5,1.5)) grid() # xp is a grid variable for ploting xp <- seq(-3,3,by=0.01) x_exp <- data.frame(f1=x,f2=x^2) fit <- lm(y~.-1,data=x_exp) xp_exp <- data.frame(f1=xp,f2=xp^2) yp <- predict(fit,xp_exp) lines(xp,yp) # using poly function fit2 <- lm(y~ poly(x,degree=2) -1) yp <- predict(fit2,data.frame(x=xp)) lines(xp,yp,col=2) 我的尝试: 截距似乎是一个问题,当我将模型与截距拟合时,即-1在模型中不存在时formula,这两行是相同的。但是,为什么没有截距,这两行是不同的? …

1
为什么对poly(raw = T)与poly()会得到截然不同的结果?
我想对两个不同的时间变量建模,其中一些在我的数据中高度共线性(年龄+同​​类=周期)。这样做会给lmer和的相互作用带来麻烦poly(),但可能不限于lmer与nlmeIIRC 取得相同的结果。 显然,我对poly()函数的功能缺乏了解。我了解是什么poly(x,d,raw=T),我认为没有raw=T它就可以构成正交多项式(我不能说我真的很明白这是什么意思),这使拟合更容易,但不能让您直接解释系数。 我读到这是因为我使用的是预测函数,所以预测应该相同。 但是,即使模型正常收敛,它们也不是。我正在使用居中变量,我首先想到,正交多项式可能会导致与共线交互作用项有更高的固定效应相关性,但似乎具有可比性。我在这里粘贴了两个模型摘要。 这些图有望说明差异的程度。我使用了仅在开发人员中可用的预测功能。版本是lme4的版本(在这里听说过),但是固定效果在CRAN版本中是相同的(并且它们本身也看起来不一样,例如,当我的DV的范围为0-4时,交互作用约为5)。 lmer电话是 cohort2_age =lmer(churchattendance ~ poly(cohort_c,2,raw=T) * age_c + ctd_c + dropoutalive + obs_c + (1+ age_c |PERSNR), data=long.kg) 该预测仅是对假数据(所有其他预测变量= 0)的固定影响,其中我将原始数据中存在的范围标记为外推=F。 predict(cohort2_age,REform=NA,newdata=cohort.moderates.age) 如果需要的话,我可以提供更多背景信息(我无法轻松地产生一个可复制的示例,但是当然可以更加努力地尝试),但是我认为这是一个更基本的要求:poly()请向我解释该功能。 原始多项式 正交多项式(在Imgur处为修剪的,未修剪的)

3
如何将和包括在回归中,以及是否将它们居中?
我想将项及其平方(预测变量)包括在回归中,因为我假设低值对因变量有积极影响,而高值则有负面影响。在应该捕获更高价值的作用。因此,我期望的系数为正,的系数为负。除了,我还包括其他预测变量。xxxx2x2x^2xxxx2x2x^2xxxx2x2x^2xxx 我在这里读过一些文章,在这种情况下,最好将变量居中以避免多重共线性。 进行多元回归时,何时应将预测变量居中以及何时应对其进行标准化? 我应该分别将两个变量居中(平均)还是应该仅居中然后取平方,还是应该仅居中并包含原始?xxxx2x2x^2xxx 如果是一个计数变量,是否有问题?xxx 为了避免成为计数变量,我考虑过将其除以理论上定义的面积,例如5平方公里。这应该有点类似于点密度计算。xxx 但是,恐怕在这种情况下,如和x²= 4时,我对系数符号的最初假设将不再成立。x=2x=2x=2x²=4x²=4x²=4 x=2/5 km2x=2/5 km2x= 2 / 5 \text{ km}^2 = 0.4 km20.4 km20.4 \text{ km}^2 但是x2x2x^2会更小,因为 x2=(2/5)2=0.16x2=(2/5)2=0.16x^2= (2/5)^2= 0.16。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.