与目标变量高度相关的特征

数据挖掘 机器学习 特征选择 特征工程 相关性
2022-02-11 22:21:16

如果其中一个预测变量与目标变量高度相关(比如 0.9),我们应该怎么做?我们应该放弃它还是保留它来构建预测模型(分类或回归)?

1个回答

您应该保留它,与目标变量的相关性越高 - 特征越好。但是 - 您还应该确保这种相关性是“真实的”,即不是由于数据泄漏。

(答案是使用@GeoMatt22 和@Ubikuity 评论编写的。)