为什么训练模型给出了很好的结果但真实数据给出了非常糟糕的结果:Azure ML Studio

数据挖掘 机器学习 决策树 准确性 天蓝色毫升
2022-03-16 08:31:34

我正在使用二级提升决策树来训练模型。

评价结果我会说真的很好。

但是当我使用真实的数据集时 - 结果非常糟糕。

什么可能会出错,从而产生如此巨大的差异?

下面是我的模型的截图:

在此处输入图像描述

两个类提升决策树参数(默认):

在此处输入图像描述

1个回答

你的问题不清楚。有两种理解方式。您使用哪个数据集来训练您的模型?

  1. 您在预制数据集上进行了训练和测试。结果很好。然后你将此模型应用于真实数据集,结果非常糟糕。

如果是这种情况,您应该在您的真实数据集上重新训练或将一些迁移学习技术应用于您当前的模型。

  1. 您在预制数据集上进行了训练和测试。结果很好。使用相同的模型,您在真实数据集上进行了训练和测试,但结果要差得多。

我不能确切地说出这其中的原因。通常,真实数据的噪声要大得多。您是否在训练之前处理过丢失的数据并进行了一些特征工程?