我有 7 个类的 500+ 观察(200+ 特征向量维度),并希望提高我的分类率(使用 SVM 或 KNN)。
为了减少维度并将特征矩阵转换为较低维度(由于维度灾难),我使用了 LDA。它将我的高维数据映射到低 6 维。但是应用交叉验证的 LDA 并没有帮助并显着降低结果。
当我什至使用留一法(LOOCV)来计算 LDA 投影矩阵时,它是通过只保留一个观察值来计算的。我的问题是为什么即使在这种情况下投影矩阵() 对交叉验证的过度拟合和敏感?直观地说,我只保留了一个样本,但投影矩阵似乎无法正确映射保留的观察结果。
我对两个部分感兴趣:
- 这种实验背后的数学。
- 更好的交叉验证特征转换而不是 LDA 的一些考虑或解决方案。
更新
- 基于@Andrew M,最初的回应,我每堂课的观察次数不同。例如,一个类有 120 个示例观察,而另一个只有 40 个。