序数响应的模型性能指标

机器算法验证 r 模型选择 预测模型 序数数据
2022-04-04 02:21:20

我有兴趣使用有序分类因变量评估模型对数据的性能。对于我的用例,理想的指标是:

  1. 不假设类之间的间隔相等或重新编码为连续规模是合适的
  2. 独立于规模
  3. 优先考虑对结果进行准确排序的模型,对具有较大差异程度的错误排序的类给予更高的惩罚(例如,优秀 > 差 > 好优于优秀 > 非常差 > 好)
  4. 接受连续的预测并对它们的分布漠不关心

例如,假设我们有以下测试集,其中“response”是 5 类序数响应,“pred1”、“pred2”和“pred3”是预测:

id      response   pred1    pred2    pred3
 1     Excellent    1.00      150       10
 2          Good     .80       39        9
 3          Good     .85       12        5
 4          Fair     .40       11        4
 5          Poor     .39       10        3
 6     Very Poor     .20        3        2
 .             .       .        .        .
 .             .       .        .        .

出于我的目的,理想的指标将所有三个预测评分为同样准确,因为这三个预测都完美地对响应进行了排名。

我有哪些选择以及每种选择的好处/缺点?引用 R 包或函数的奖励积分。

1个回答

Somers 的 Dxy 等级相关性是一个很好的衡量标准,它是对序数或连续 Y 的 ROC 面积的概括。它是针对 rms 包中 lrm 函数中的序数比例优势回归计算的。