我会对热图和变量之间的相关性有疑问。我创建了这个热图,查看变量和目标之间可能的相关性。我得到了非常小的值。我想设置一个小的阈值,例如 0.05,用于选择特征。你认为这是有道理的,还是我应该排除所有这些?
从您提供的信息来看,您似乎正在根据预测变量与目标之间的相关性进行特征选择。作为单变量过滤器选择系列中的一种特征选择(参见此处), 这是正确的,尽管不是唯一的。尽管您可以查看其他方法,但它快速且直观。你也可能对此有兴趣:
还有许多其他的特征选择策略(你可能想检查这个来源)