如果其中一个预测变量与目标变量高度相关(比如 0.9),我们应该怎么做?我们应该放弃它还是保留它来构建预测模型(分类或回归)?
与目标变量高度相关的特征
数据挖掘
机器学习
特征选择
特征工程
相关性
2022-02-11 22:21:16
1个回答
您应该保留它,与目标变量的相关性越高 - 特征越好。但是 - 您还应该确保这种相关性是“真实的”,即不是由于数据泄漏。
(答案是使用@GeoMatt22 和@Ubikuity 评论编写的。)
其它你可能感兴趣的问题