如何确定哪些变量/特征之间的关系最强?

人工智能 机器学习 相关性 相关系数
2021-11-04 12:17:49

这是我的问题:

我有 10 个变量,我打算两两(成对)评估。我想知道哪些变量之间的关系最强。我只对两两评估关系感兴趣。好吧,一个建议是计算这些变量的成对相关系数。然后将具有最高相关系数的对列出到最低相关性。这样我就可以在最相关和最低相关对之间进行排名。

我的问题是:在人工智能的世界里有什么类似于相关系数计算的东西吗?也就是说,人工智能/机器学习的世界可以为我提供哪些工具来提取此类信息?所以最后我可以从人工智能/机器学习的角度来看,在最“相关”的对中进行排名?

换句话说,例如,我如何知道这 10 个变量中的哪个变量与变量 7 最好“相关”(或“相关”)?

1个回答

听起来您有一系列数据点,每个数据点都有 10 个相关的测量值,并且您希望自动评估哪些测量值彼此最密切相关。

你是对的,相关系数是一个很好的选择。

一些 AI 算法中使用的其他技术包括信息增益测量(测量一个变量在对另一个变量进行分区后的熵减少)和嵌入式特征选择方法,如本文中的方法。