我有一个包含几个连续变量和四个分类变量的线性模型,每个变量分别由 12、3、4 和 5 个虚拟变量表示。当使用模型选择标准(例如 PRESS、Mallows Cp 和 BIC)时,每个标准返回的最佳模型仅包含每个分类变量的一些虚拟变量。据我了解,这不是一个好的做法,模型中必须包含所有或不包含任何假人。有没有办法让飞跃将每个分类变量的虚拟变量视为一个变量?
另外,可以将此方法扩展为与 glmnet 包一起使用吗?我对套索和岭回归有同样的问题。
编辑:有没有办法指定一个带有自变量子集的 lm 对象被视为一个对象?