我遇到过线性和多元回归、SVM、随机森林。有人知道使用 Pearson 相关或 Spearman 相关的机器学习算法吗?最好的,戴夫
使用 Pearson 或 Spearman 相关性的机器学习算法?
数据挖掘
机器学习
相关性
2021-10-06 19:14:50
2个回答
我认为这不存在。我想一个算法可以使用皮尔逊系数作为起始系数,但老实说,这似乎是一种计算资源的浪费。以下是我想到为什么这是一个坏主意的一些原因:
- 随着维数的增加,Pearson 和 Spearman 相关性变得越来越有意义。我通常使用数百万个维度......单个特征的斯皮尔曼相关性?
- 在稀疏矩阵中,这些系数几乎没有任何意义,因为特征和目标之间只有非常轻微的相关性。通常,这是我们试图找到的多维关系(这里有很多警告:P)
- Pearson 和 Spearman 相关假设某些参数在 ML 应用中通常不正确,例如同方差、线性、正态性等。
由于上述和许多其他原因,恕我直言,在 ML 算法中的任何地方使用这些都没有任何目的。
我认为这取决于上下文-您是否对建模+预测算法或特征选择算法感兴趣。
我不知道任何明确使用相关性的建模+预测算法。
我不明白为什么特征选择方法不能使用相关性,尽管如前面的答案中所述,相关性依赖于在野外可能不成立的假设。
其它你可能感兴趣的问题