我知道删除相关特征会更好,但是如果特征与目标标签相关怎么办?那么,它提供了最多的预测信息?我是否需要删除与目标标签相关的特征?
移除与目标标签相关的特征
数据挖掘
熊猫
相关性
数据框
数据分析
2022-03-05 11:24:53
2个回答
删除相互关联的特征背后的想法是,通过增加观察中每个特征的独立性,可以创建更好的模型。还有另一个线程更详细地说明了这里的原因。
但是,您问题的奇怪部分是您正在比较因变量和自变量之间的相关性。这种类型的比较通常在构建模型之后进行,以防止评估模型的预测强度。在此之前将目标标签(您希望预测的标签)与其他变量进行比较还为时过早,并且可能会削弱您的模型。
在测试相关特征时,最好先删除目标标签,然后再检查相关性并确定要删除的标签(如果有)。然后,如果您想进一步删除特征,您可以对数据执行主成分分析。从那里您可以通过逻辑回归模型运行数据,并从那里选择最重要的特征,就像这里提到的那样。
其它你可能感兴趣的问题