在数据建模中使用负相关特征可以吗?假设我有相关系数为 0.2 的特征A和相关系数为 -0.2 的特征,是否可以在模型中使用特征,因为它们的负相关性较低?另外,这对回归和分类问题有不同的影响吗?BCDCD
负相关特征
数据挖掘
相关性
2021-09-25 00:35:29
2个回答
负相关与正相关一样有效和有用。
在您的示例中,0.2 相关性和 -0.2 相关性在您的模型中具有相同的值。负相关只是意味着当一个值上升时,另一个值下降。
此外,正相关越接近 1,负相关越接近 -1,它对建模算法就越有用。
对于大多数算法,自变量不必不相关才能在模型中使用。大多数模型将处理特征之间的互相关,在某些情况下,删除其中一个实际上可能是有害的,可能会丢失一些对模型有用的信息。
通常,如果我们有太多的特征,它们太稀疏,或者我们的特征与行的比率太高,我们就会丢弃它们。
这两个事实同样适用于分类和回归。
负相关没有问题,事实上,如果你改变C相关-C性将是正的,并且我知道的每个机器学习模型都应该在一个变量上进行等效训练,或者与符号改变的相同。
所以不,在任何有监督的情况下,回归或分类,特征之间是否存在负相关并不重要,而且几乎每次都会发生。
其它你可能感兴趣的问题