热图和变量之间的相关性

数据挖掘 机器学习 特征选择 相关性 热图
2022-03-15 03:27:28

我会对热图和变量之间的相关性有疑问。我创建了这个热图,查看变量和目标之间可能的相关性。我得到了非常小的值。我想设置一个小的阈值,例如 0.05,用于选择特征。你认为这是有道理的,还是我应该排除所有这些?

在此处输入图像描述

1个回答

从您提供的信息来看,您似乎正在根据预测变量与目标之间的相关性进行特征选择。作为单变量过滤器选择系列中的一种特征选择(参见此处),
这是正确的,尽管不是唯一的。尽管您可以查看其他方法,但它快速且直观。你也可能对此有兴趣:

  • 方差阈值选择(也是每个输入特征,单变量过滤方法):它假设特征值的更高方差可能意味着更多的预测能力
  • 顺序后向选择看这里):这意味着更多的性能成本,但是特征是在子集中判断的(不是像上面那样独立),如果你没有很多特征(看起来是这样)也可以

还有许多其他的特征选择策略(你可能想检查这个来源