如前所述,我有一个分类问题和不平衡的数据集。多数类包含所有样本的 88%。我已经使用in 包训练了一个广义 Boosted Regression 模型gbm(),并获得以下输出:gbmR
interaction.depth n.trees Accuracy Kappa Accuracy SD Kappa SD
1 50 0.906 0.523 0.00978 0.0512
1 100 0.91 0.561 0.0108 0.0517
1 150 0.91 0.572 0.0104 0.0492
2 50 0.908 0.569 0.0106 0.0484
2 100 0.91 0.582 0.00965 0.0443
2 150 0.91 0.584 0.00976 0.0437
3 50 0.909 0.578 0.00996 0.0469
3 100 0.91 0.583 0.00975 0.0447
3 150 0.911 0.586 0.00962 0.0443
查看 90% 的准确率,我假设该模型已将所有样本标记为多数类。这很清楚。还有什么不透明:如何计算 Kappa。
- 这个 Kappa 值(接近 60%)到底意味着什么?仅仅说模型对它们进行分类不是偶然就足够了吗?
- 是什么
Accuracy SD意思Kappa SD?