我在考虑交叉验证以及它如何是最合适的方法......
让我们以二元逻辑回归为例,其目标是计算 AUC。
使用 k 折对数据进行分区。获得交叉验证 AUC 的正确方法是什么:
1) 使用 k-1 折训练模型并预测第 k 折。计算 AUC 并重复,直到所有折叠都用作测试集。这将在最后给出 k AUC 值,我们将其平均以获得交叉验证的 AUC。
2) 使用 k-1 折训练模型并预测第 k 折。保存预测。重复直到所有折叠都作为测试集。这将给出一个预测向量,针对数据集中的每个主题。使用此预测向量和观察到的响应向量计算 AUC。
我对交叉验证的直觉和想法表明2)是正确的......