我很好奇弹性网系数的解释

数据挖掘 Python scikit-学习 弹性网
2022-03-09 12:09:57

我想通过 sklearn 的 Elactic Net 发现变量在数据中的重要性。但我不明白系数的确切含义。训练时,我使用了 alpha: 0.01585598, l1_ratio: 1.000。
下图是根据我的数据绘制的系数图。我的目标是通过各种变量来预测“时间花费”。由于个人信息,列名标有A、B、C、D,敬请谅解。 在此处输入图像描述

在图中,变量“A”对于大于 150 的系数意味着什么?我是否需要了解在预测“时间花费”时使用变量“A”需要超过 150 秒?还是仅仅意味着变量“A”与“y”的值具有高度正相关?我通过学习画了一个系数图,但我是在问一个问题来准确理解其含义。
感谢您阅读到这里!

1个回答

线性模型的形式为:

y=ax1+bx2+cx3.....

其中是特征,字母 a,b,c 是系数。xn

在您的图中,您正在绘制系数 a,b,c ...

假设你的系数是a=1b=2c=10

如果您的特征是 x1=0x2=10x3=1

那么你的预测将是 y=10+210+101=30

对于大于 150 的系数,变量“A”是什么意思?没什么特别的,它只是一个乘法。

我是否需要了解在预测“时间花费”时使用变量“A”需要超过 150 秒?它与算法的计算时间无关。它与功能的含义有关。