什么是基准模型?

数据挖掘 数据挖掘 分类 决策树 预处理
2021-10-12 01:08:51

我正在研究乳腺癌数据集(http://kdd.org/kdd-cup/view/kdd-cup-2008)。在进行任何必要的预处理之后,我需要使用 C4.5 算法对数据进行分类。

我必须写的报告的一部分是“基准模型”,我不知道这是什么意思。我用谷歌搜索了这个词,它似乎在数据挖掘中没有得到很好的定义。知道这意味着什么吗?

谢谢!

1个回答

基准测试是将您的结果与现有方法进行比较的过程。例如,您可以使用另一篇论文与已发表的结果进行比较。如果没有其他明显的方法可以作为基准,您可以将其与最好的简单解决方案(猜测均值、猜测多数类等)或非常简单的模型(简单回归、K 最近邻)进行比较。如果对该领域进行了深入研究,您可能应该以当前发布的最先进技术(并可能在相关时以人类表现为基准)进行基准测试。