使用预测:数据与预测变量的目标不同

数据挖掘
2022-02-20 17:27:01

根据橙色视频教程:youtu.be/D6zd7m2aYqU ?list=PLmNPvQr9Tf-ZSDLwOzxpvY-HrE0yv-8Fy

我正在尝试根据已经“编码”的数据集对新数据集进行预测 - 两个数据集的格式完全相同,其中“训练”集的所有条目都标记为 1 或 0,见下文:

在此处输入图像描述

而第二组不包含任何值,因为我希望“预测”功能会尝试猜测状态:

在此处输入图像描述

麻烦的是,当我查看预测小部件时,它什么也不做,显示“数据与预测变量的目标不同”

我只使用 Orange 两天,所以我想这对我来说是一个非常简单的错误。

任何帮助将不胜感激。

约翰

2个回答

这是因为我们必须从第二个文档(测试数据集)中排除目标列。

在您的示例中,从第二个文件中删除“状态”列。

示例

在下面的示例中,在训练数据集中,存在作为目标字段的“Loan_Status”列,而在测试数据集中,“Loan_Status”列不存在,将由“预测”计算,如下所示:

训练和测试数据集

预测

预测值

这可能是橙色工具中的一个错误,因为数据集看起来格式正确。我建议您将所有数据(两个数据集)放在一个文件中并将其加载到橙色上,如果可以,则拆分文件(分离数据)并重新加载两个新文件,它应该可以工作。