我知道逐步回归分析有很多局限性,包括假设预测变量彼此之间的相关性不高。事实上,这个限制是我改用 Elastic Net 的最重要原因,因为我的模型中有 75 个预测变量,其中一些是高度相关的。
使用 Elastic Net,我可以将预测变量减少到 21 个。我在多线性回归模型中使用了这 21 个变量并计算了决定系数 ()。
但是,当我对相同的数据使用逐步分析时,只选择了 11 个变量,而 R 方保持不变!这是否意味着我的逐步分析结果可以解释更高比例的结果?如果是这样,当我获得更好的结果时,如何证明 Elastic Net 上的逐步分析的局限性?