机器算法验证 - 为主成分回归选择最佳特征向量集 - 吾爱随笔录

我正在测试用于处理回归问题中的强多重共线性 (MC) 的各种技术。

在诸如岭回归 (RR) 和主成分回归 (PCR) 等竞争技术之间已经有各种比较论文。尽管最好的技术似乎是针对特定问题的，但似乎没有明确的赢家。然而，PCR 方法困扰我的一件事是有点武断的方式，即简单地排除最小的特征向量，正如在 Hadi 和 Ling 中所证明的那样，即使最小的特征向量也可能具有很强的预测能力，而最大的特征向量可能没有。

Hadi 和 Ling 的“关于使用主成分回归的一些注意事项”。( PDF )

他们还表明，通过添加看似微不足道的特征向量，可以极大地改进 SSE。

在他们的讨论中，他们强调了两篇试图解决第二个缺陷的论文——Lott（1973）和 Gunst 和 Mason（1973）——但是已经表明 Lott 技术在存在强大的 MC，而我的问题有强大的 MC。

您是否知道即使在存在强 MC 的情况下也可以选择最佳特征值集的论文？或者最近比较 PCR 和 RR 的论文？