我刚刚(模糊地)被介绍到brownian/distance covariance/correlation。在测试依赖性时,它似乎在许多非线性情况下特别有用。但它似乎并不经常使用,即使协方差/相关经常用于非线性/混沌数据。
这让我认为距离协方差可能存在一些缺点。那么它们是什么,为什么不是每个人都总是使用距离协方差?
我刚刚(模糊地)被介绍到brownian/distance covariance/correlation。在测试依赖性时,它似乎在许多非线性情况下特别有用。但它似乎并不经常使用,即使协方差/相关经常用于非线性/混沌数据。
这让我认为距离协方差可能存在一些缺点。那么它们是什么,为什么不是每个人都总是使用距离协方差?
根据我阅读下面列出的参考资料的印象,我试图收集一些关于距离协方差的评论。但是,我不认为自己是该主题的专家。欢迎评论、更正、建议等。
正如原始问题中所要求的那样,这些评论(强烈)偏向于潜在的缺点。
在我看来,潜在的缺点如下:
重申一下,这个答案可能非常消极。但是,这不是本意。距离协方差有一些非常漂亮和有趣的想法,它的相对新颖性也为更全面地理解它开辟了研究途径。
参考资料:
我很可能遗漏了一些东西,但仅仅量化两个变量之间的非线性依赖似乎并没有太大的回报。它不会告诉你关系的形状。它不会给你任何方法来预测另一个变量。以此类推,在进行探索性数据分析时,有时会使用黄土曲线(局部加权散点图平滑器)作为查看数据是否最好用直线、二次、三次等建模的第一步。但是在和本身并不是一个非常有用的预测工具。这只是寻找一个可行的方程来描述双变量形状的方法的第一个近似值。与黄土(或距离协方差结果)不同,该方程可以构成验证模型的基础。