在 CRISP-DM 的构建模型、评估模型和评估结果步骤中报告什么?

数据挖掘 机器学习 分类 监督学习
2021-09-20 07:08:31

如果您能告诉我在 CRISP-DM 的以下步骤中报告什么,我将不胜感激?

  • 构建模型:参数设置、模型和模型描述应该报告什么?我使用网格搜索来调整超参数。
  • 评估模型:模型评估和修改参数设置应该报告什么?
  • 评估结果:评估数据挖掘结果应该报告什么?

在此处输入图像描述

事实上,我只使用逻辑回归来执行分类任务,使用如下所示的过程: 在此处输入图像描述

是否可以将测试数据集的最终模型评估视为评估结果的一部分,或者应该对新数据进行评估?

1个回答

你试图呈现结果的方式非常好。

我不能说以下程序是我的场景中的标准程序,我做了这样的事情: CRISP-DM

这就是我向我的经理介绍的方式,以使他们了解我遵循的程序。

我为每个部分制作了一张幻灯片,并突出显示了它们需要了解的要点。

在显示结果时,我以不同的方式命名数据(准确度)

  1. 训练集准确率:占总数据集的 70%,得出准确率 % 也称为模型准确率
  2. 测试集准确度:占总数据集 30% 的测试集,得出的准确度称为测试准确度
  3. Blind Test Accuracy:这是全新的数据,这里我用整个数据集训练模型,然后使用新数据进行测试(你也可以称之为验证集)

我是这样介绍的: 精度表

由于您的问题也是一个分类问题,可以更好地解释它,我给了他们细分:

准确性的进一步细分

如果您有任何问题,请告诉我,很乐意为您提供帮助。