训练分类模型后影响个体预测的特征

数据挖掘 分类 特征选择
2022-02-26 00:17:00

我知道我的问题可能看起来很奇怪,但我只是想获得一些见解。每个预测模型都会为我们提供验证数据集的预测,它还可以根据它们对预测的权重给出/排名特征。我正在寻找在那之后的一步。假设我们正在处理员工辞职,我们知道最重要的特征是薪酬、最新晋升、工作满意度和员工住所周围的外部工作机会。现在,有什么方法可以说这些特征中的哪一个是个体预测最重要的特征?可能对于一名员工来说,工作满意度是休假的原因,但基于我们的特征重要性,我们需要首先关注薪酬。我只是想知道我们是否可以对每个单独的预测进行一些后期处理?

谢谢

1个回答

根据您使用的模型,在预测时将事物相乘和相加的方式略有不同,但原则上都是一样的。您训练一个模型,该模型试图学习您为其提供的特征向量与相关目标的关系。在预测时,相同的数学运算将应用于您尝试对其进行预测的每个输入。因此,您在训练阶段学到的权重代表了整个训练集中的特征重要性,您希望在其中推广到看不见的“测试”数据。如果您怀疑员工决定辞职的原因超出了模型权重告诉您的其他原因,这表明您的模型没有足够的特征来区分“不辞职”与“不辞职”这两类。