我有一个包含 77 个样本的数据集,其中包含 302 个带有两个标签 (0,1) 的特征。我用 gridsearch (cv=5) 训练了一个 SVM 来执行二进制分类。
在我的脚本的一次运行中,我进行了测试训练拆分,然后将训练数据传递到 gridsearch。我得到了广泛的训练准确度(>70-90%)和测试准确度(40-75%)。我的问题是,如果我的模型看起来是基于火车的/因为我的数据似乎根据拆分得到不同的结果,我该如何评估我的模型。
我所做的是:在循环中运行整个脚本并迭代 10 个不同的拆分,然后在 ROC 曲线上绘制误差线。这合理吗?