检查回归系数的稳定性?

数据挖掘 回归
2022-03-11 14:49:15

我有一个包含 13 个自变量(其中 2 个是分类变量)和 678 个观察值的模型。所有变量都很重要。我打算检查系数的稳定性。我的方法是从具有一个变量的模型开始并找到该系数。然后我将添加另一个变量;但是,我也保留了以前的变量。我将继续,直到所有变量都在最终模型中。我正在使用以下 R 代码:

add.APV<-lm(HPV~log(APV),data=Mydata)
add1(add.APV,scope =~ AWD + Variety.bodyandchassis + Flexibility + Model.types + Year + log(CAC)+ Outsourcing + Platformstrategy + Hourly.total + Newownership + Vehicle.Launch + Segment.MD., test="F", k=2, trace=TRUE)

我收到以下错误:

Error in factor.scope(attr(terms1, "factors"), list(add = attr(terms2,  : 
  upper scope has term ‘NA’ not included in model

我想知道问题是什么。对于任何反馈,我们都表示感谢。

2个回答

我遇到了同样的问题,我的数据都是数字的,没有 NA。修复真的很简单:而不是 scope = ~ var1 + var2 + ...,你应该使用 scope = ~ 。+ 变量 1 + 变量 2 + .... 似乎这应该包含在其帮助页面上的 add1 示例中。

您的数据文件将一些数值变量作为具有许多类别的因子读取。

numeric <- apply(Mydata,2,is.factor)

glm.model_step_1 <- glm(scope ~ AWD + Variety.bodyandchassis + Flexibility + Model.types + Year + log(CAC)+ Outsourcing + Platformstrategy + Hourly.total + Newownership + Vehicle.Launch + Segment.MD., data = na.omit(Mydata), 
                    family = binomial(link = 'logit'))

add1(glm.model_step_1, scope=~.)