我目前正在开发三种模型来对基因位点的特征进行分类。
我使用 glm(带有 Firth 校正)、随机森林和 SVM 来构建模型,我使用 glm 的前向和后向选择(forward
和backward
函数 from logistf
),使用 oob 错误选择(使用varSelRF
包varSelRF
中的函数)和函数svm.fs
frompenalizedSVM
为模型选择变量的包。
我使用交叉验证来验证训练数据的模型构建。我在测试数据上生成了性能的 ROC 曲线,因为我想使用 ROC 作为拟合优度度量。
现在我的问题是:就最佳(即最佳预测精度)模型而言,比较每条ROC曲线的AUC并选择AUC最高的模型作为最佳模型是否足够?
感谢您的回答!