在将我的预测值与真实标签值绘制之后,我并没有完全得到我正在寻找的答案

数据挖掘 回归 线性回归
2022-02-07 21:17:50

我下载了有关葡萄酒质量的数据并尝试运行回归模型来预测质量,但是我没有收到我期望的情节。葡萄酒质量的平均绝对误差约为 0.5,因此我认为真实值与预测值图看起来非常相似,但我得到的图表并不是我所期望的。当您使用离散参数时会发生这种情况吗?

由于我是新手,所以我的印象是,如果您的预测值和真实值非常相似,那么这个最终图将始终类似于您的标准线性图。

得到的图表

如果有帮助,这是我的代码的链接:https ://colab.research.google.com/drive/1mxRIx5ufVsA0ljdTpL0Ud0qm2y39eyGX

1个回答

真实质量是 4,5,6……预测质量与真实质量有偏差。这种偏差通​​过 x 轴上的点的变化来表示。图中的线显示,您的预测与真实状态之间存在正相关(这是好的和预期的)。

想想你的情况下 mae 0.5 的大小。意思是“错了一半”。您可能在真实值周围有一些预测值集中(在这样的图中不好发现)和一些离群值,即相对较差的预测,它们与真实类别相去甚远。您还可以看到您的预测对低类和高类都不好。

我猜这是线性回归?尝试多项式 logit 等。在你的线性回归中,预测可以是任何有理数。作为预测,你想要的是一个类,所以 4,5,6 或任何类的名称。