我正在使用引导方法对使用标准逻辑回归或弹性网络构建的多元模型进行内部验证。
我使用的程序如下:
1)使用整个数据集建立模型,得到预测值,计算AUC(AUC_ap,明显的)
2) 生成从原始数据集派生的 100-500 个引导样本
3) 对于每个 bootstrap 样本,按照与 #1 中相同的程序,获得 i) 当前 bootstrap 样本和 ii) 原始数据集的预测值和 auc
4)计算100-500个引导样本中的每一个的i)和ii)(在#3中)之间的差异,并取平均值->“乐观”
5)计算乐观校正AUC:AUC_ap - 乐观
我的问题是什么 ROC 曲线最适合在论文中呈现?例如,在步骤#1 中推导出的 ROC 是一种选择,但显然是乐观的。或者,我尝试使用 R 包 ROCR 生成“平均 ROC”,基于步骤 #3 (ii) 中得出的 ROC 曲线。但是,我认为 [这些 ROC 曲线的平均值] 的 AUC 不等于在步骤 #5 中获得的值。
非常感谢任何输入!-M