我正在尝试将一个小数据集(大约 500 条记录)分为两类。我使用了各种方法,如 SVM、朴素贝叶斯和 k-nn 分类器。现在,我想将其中一个分类器的结果设置为我的基线并执行统计假设检验。我对这个统计测试领域不太熟悉,我想知道如何进行。
我一直在考虑将 SVM 分类器设置为我的基线,但我不确定如何对数据执行 t 检验(或类似检验)。输入数据集有 10 个属性。我应该使用两个分类器的分类结果并对它们进行配对 t 检验吗?例如,我可以从朴素贝叶斯中获取结果,并使用 SVM 结果(这是基线)执行配对 t 检验。这是正确的方法吗?
另外,我对无效假设和替代假设的解释感到困惑。有人愿意就如何修复零假设和替代假设提供一个想法。