我正在使用caret
包R
来训练二进制 SVM 分类器。为了减少功能,我preProc=c("pca")
在调用时使用内置功能使用 PCA 进行预处理train()
。以下是我的问题:
- 插入符号如何选择主成分?
- 是否选择了固定数量的主成分?
- 是否通过一定数量的解释方差(例如 80%)选择主成分?
- 如何设置用于分类的主成分数量?
- (我知道 PCA 应该是外部交叉验证的一部分,以允许可靠的预测估计。)PCA 是否也应该在内部交叉验证周期(参数估计)中实施?
- 插入符号如何在交叉验证中实现 PCA?