我将回答技术问题,然后尝试说服您不要这样做。
截距是横坐标为零时的预测值。因此,示例中的截距通过以下方式获得:
> mod = lm(Sepal.Length ~ Petal.Width*Species, data = iris)
> library("emmeans")
> (emm = emmeans(mod, "Species", at = list(Petal.Width = 0)))
NOTE: Results may be misleading due to involvement in interactions
Species emmean SE df lower.CL upper.CL
setosa 4.78 0.173 144 4.43 5.12
versicolor 4.04 0.464 144 3.13 4.96
virginica 5.27 0.509 144 4.26 6.28
Confidence level used: 0.95
...并且可以通过这种方式测试其比较:
> pairs(emm)
contrast estimate SE df t.ratio p.value
setosa - versicolor 0.733 0.495 144 1.480 0.3037
setosa - virginica -0.492 0.538 144 -0.915 0.6316
versicolor - virginica -1.225 0.689 144 -1.779 0.1804
P value adjustment: tukey method for comparing a family of 3 estimates
也就是说,截距是一个有趣或有意义的量,需要对其进行推断,这是一个不寻常的例子。在许多数据集中,截距是一种严重的外推,因为零的预测值与其观察值相去甚远。模型只是对事实的近似,人们是否应该相信你拟合的直线实际上代表了远处的趋势,这是非常值得怀疑的。
因此,我敦促您重新考虑您正在尝试做的事情,并决定您真正想要回答的有意义的问题。