我想证明在给定少量数据进行训练时,我提出的机器学习算法(prop_ml)优于其他基线算法(ml_1、ml_2、ml_3)。我所做的是将数据集拆分为训练集和测试集。然后,我从训练集中随机选择了小k 个样本(10、20、30、... 100),并用它们来训练分类器并使用测试集进行测试。我已经复制了 5 次以确保得到一些可靠的结果。
现在,我想评估结果。关于统计测试的任何建议,我可以用来证明提议的 ml 是否更好?谢谢。
我想证明在给定少量数据进行训练时,我提出的机器学习算法(prop_ml)优于其他基线算法(ml_1、ml_2、ml_3)。我所做的是将数据集拆分为训练集和测试集。然后,我从训练集中随机选择了小k 个样本(10、20、30、... 100),并用它们来训练分类器并使用测试集进行测试。我已经复制了 5 次以确保得到一些可靠的结果。
现在,我想评估结果。关于统计测试的任何建议,我可以用来证明提议的 ml 是否更好?谢谢。
用于比较模型的检验包括 ANOVA(基于卡方的检验,F 检验)、基于对数似然的检验(偏差、Wilk's lambda)或基于 AIC/BIC 的检验(惩罚偏差)。