交叉验证分数的标准差是多少?

机器算法验证 机器学习 标准错误 描述性统计 scikit-学习
2022-04-02 18:10:57

在对模型选择进行交叉验证时,我发现有很多方法可以引用交叉验证分数的“标准差”(这里的“分数”是指评估指标,例如准确度、AUC、损失等)

  1. 一种方法是计算分数平均值的标准差K折叠(=标准偏差K折叠 /K)。
  2. 第二种方法是只计算分数的标准差K折叠。一个例子可以在这里找到。
  3. 另一种我不太明白的方式。似乎计算标准差K折叠 /N在哪里N是数据集的大小...

我个人认为 1) 是正确的,因为我们更关心样本均值的标准误差(这里的样本均值 =K折叠验证)而不是样本的标准差。谁能解释首选哪种方式?

0个回答
没有发现任何回复~