机器算法验证 - 带有跳跃的 Regsubsets 失败 - 吾爱随笔录

我试图解决regsubsetsR 中的跳跃问题。我的问题特别强烈共线，这就是为什么我首先选择使用它的原因。

变量的数量约为 200，我有大约 200 万个独立观察值。所有变量之间都具有很强的相关结构。

really.big = TRUE在使用, 和nvmax = 5运行regsubsets 时nbest = 1，我得到以下信息：

jumps.setup 中的错误 - 找到 31 个线性依赖项

它崩溃了。我要做的只是一个简单的逐步前进，比如按相关顺序对变量进行排序并运行嵌套回归。

软件处理的太多了吗？从这个意义上说，我认为这个问题已经很好地提出了。