情况
我有一个数据集,其中一个依赖和一个自变量。我想拟合一个连续分段线性回归,其中个已知/固定断点发生在。断点是已知的,没有不确定性,所以我不想估计它们。然后我拟合 这是一个例子
R
set.seed(123)
x <- c(1:10, 13:22)
y <- numeric(20)
y[1:10] <- 20:11 + rnorm(10, 0, 1.5)
y[11:20] <- seq(11, 15, len=10) + rnorm(10, 0, 2)
假设断点出现在:
mod <- lm(y~x+I(pmax(x-9.6, 0)))
summary(mod)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 21.7057 1.1726 18.511 1.06e-12 ***
x -1.1003 0.1788 -6.155 1.06e-05 ***
I(pmax(x - 9.6, 0)) 1.3760 0.2688 5.120 8.54e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
两个段的截距和斜率分别为:第一个为和 ,第二个分别为和
问题
- 如何轻松计算每个段的截距和斜率?是否可以对模型进行重新参数化以在一次计算中执行此操作?
- 如何计算每个段的每个斜率的标准误差?
- 如何测试两个相邻的斜率是否相同(即断点是否可以省略)?