我正在测试用于处理回归问题中的强多重共线性 (MC) 的各种技术。
在诸如岭回归 (RR) 和主成分回归 (PCR) 等竞争技术之间已经有各种比较论文。尽管最好的技术似乎是针对特定问题的,但似乎没有明确的赢家。然而,PCR 方法困扰我的一件事是有点武断的方式,即简单地排除最小的特征向量,正如在 Hadi 和 Ling 中所证明的那样,即使最小的特征向量也可能具有很强的预测能力,而最大的特征向量可能没有。
Hadi 和 Ling 的“关于使用主成分回归的一些注意事项”。( PDF )
他们还表明,通过添加看似微不足道的特征向量,可以极大地改进 SSE。
在他们的讨论中,他们强调了两篇试图解决第二个缺陷的论文——Lott(1973)和 Gunst 和 Mason(1973)——但是已经表明 Lott 技术在存在强大的 MC,而我的问题有强大的 MC。
您是否知道即使在存在强 MC 的情况下也可以选择最佳特征值集的论文?或者最近比较 PCR 和 RR 的论文?