情况
我有一个具有一个因变量和一个独立变量的数据集。我想用出现在已知/固定断点拟合连续分段线性回归。已知breakpoins没有不确定性,所以我不想估计它们。然后,我拟合以下形式的回归(OLS): 这是
R
set.seed(123)
x <- c(1:10, 13:22)
y <- numeric(20)
y[1:10] <- 20:11 + rnorm(10, 0, 1.5)
y[11:20] <- seq(11, 15, len=10) + rnorm(10, 0, 2)
假设断点出现在:
mod <- lm(y~x+I(pmax(x-9.6, 0)))
summary(mod)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 21.7057 1.1726 18.511 1.06e-12 ***
x -1.1003 0.1788 -6.155 1.06e-05 ***
I(pmax(x - 9.6, 0)) 1.3760 0.2688 5.120 8.54e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
两个线段的截距和斜率分别为:第一个为和,第二个为和。
问题
- 如何轻松计算每个线段的截距和斜率?可以通过一次计算对模型进行重新模型化吗?
- 如何计算每段斜率的标准误差?
- 如何测试两个相邻的斜率是否具有相同的斜率(即是否可以省略断点)?
x
和I(pmax(x-9.6,0))
,是正确的?