最近,我读了两篇文章。Speed 的文章是关于相关性的历史的,Reshef 等人的文章。是关于一种称为最大信息系数(MIC)的新方法。我需要您的帮助来理解 MIC 方法来估计变量之间的非线性相关性。
此外,MIC 在 R 中的使用说明可以在作者的网站上找到(在下载下):
我希望这将是一个讨论和理解这种方法的好平台。我的兴趣在于这种方法背后的直觉以及如何以作者所说的方式扩展它:
...我们需要扩展到. 我们将想知道需要多少数据才能获得 MIC 的稳定估计,它对异常值的敏感程度,它将错过哪些三维或更高维的关系等等。MIC 是向前迈出的一大步,但还有更多的步骤需要采取。
引文
速度,T. (2011)。21 世纪的相关性。科学,334(6062),1502-1503。
Reshef,DN,等人。(2011)。检测大型数据集中的新关联。科学,334(6062),1518-1524。