移除与目标标签相关的特征

数据挖掘 熊猫 相关性 数据框 数据分析
2022-03-05 11:24:53

我知道删除相关特征会更好,但是如果特征与目标标签相关怎么办?那么,它提供了最多的预测信息?我是否需要删除与目标标签相关的特征?

2个回答

删除相互关联的特征背后的想法是,通过增加观察中每个特征的独立性,可以创建更好的模型。还有另一个线程更详细地说明了这里的原因

但是,您问题的奇怪部分是您正在比较因变量和自变量之间的相关性。这种类型的比较通常在构建模型之后进行,以防止评估模型的预测强度。在此之前将目标标签(您希望预测的标签)与其他变量进行比较还为时过早,并且可能会削弱您的模型。

在测试相关特征时,最好先删除目标标签,然后再检查相关性并确定要删除的标签(如果有)。然后,如果您想进一步删除特征,您可以对数据执行主成分分析。从那里您可以通过逻辑回归模型运行数据,并从那里选择最重要的特征,就像这里提到的那样。

与目标变量相关的特征是帮助您预测目标的特征。

不,不要删除那些!

特征选择出人意料地充满了问题,但是从预测模型中删除一个变量,因为它与结果有明显的关系,这似乎是一种特别糟糕的方法。