我的数据是一个具有 725 个特征和 667 个观察值的矩阵,其中包含二进制数据(0 或 1)。我的目标变量是一个单变量,它有两个类(0 或 1)。我删除了作为列总和为零的特征,因此特征减少到 652。因为我有一个二进制数据,所以我没有进行预处理(平均值 = 0 和 sd = 1)。但是,我的数据非常稀疏;有 99% 的稀疏性。如果我想在 10 cv 设置中使用 LDA 模型。然后我需要删除共线特征(这意味着应该删除列和为零的训练集中的所有特征)以预测每个折叠中的一小部分测试数据。如果是这种情况,那么在每次折叠中,我都必须删除一组不同的特征,这些特征在测试集的训练集中为零。在 10 c 之后完成我的 y.predict 是否可以接受?v(每个折叠使用不同的特征来预测 y)并最终对所有折叠进行 rowmean,然后显示分类器的准确性?我无法从该策略中选择正确的特征,但我可以获得分类器预测性能。
线性判别分析(LDA),在交叉验证设置中删除共线特征是否正确?
数据挖掘
机器学习
r
lda-分类器
2022-03-02 08:32:15
0个回答
没有发现任何回复~
其它你可能感兴趣的问题