实际使用了哪些稳健的相关方法?

机器算法验证 r 相关性 强大的 斯皮尔曼罗 增删改查
2022-02-11 08:14:34

我计划进行一项模拟研究,比较几种具有不同分布(偏态、异常值等)的稳健相关技术的性能。稳健,我的意思是对a) 偏态分布、b) 异常值和 c) 重尾稳健的理想情况。

除了将 Pearson 相关性作为基线,我还考虑包括以下更强大的测量:

  • 斯皮尔曼的ρ
  • 百分比弯曲相关 (Wilcox, 1994, [1])
  • 最小体积椭球,最小协方差行列式(cov.mve/cov.mcdcor=TRUE选项)
  • 可能,Winsorized 相关性

当然还有更多的选择(特别是如果您还包括稳健的回归技术),但我想将自己限制在最常用/最有希望的方法上。

现在我有三个问题(请随意回答一个问题):

  1. 我可以/应该包括其他强大的相关方法吗?
  2. 您的领域实际 使用了哪些稳健的相关技术?(为心理学研究说话:斯皮尔曼除外 ρ,我从未见过技术论文之外的任何强大的相关技术。自举越来越流行,但到目前为止,其他可靠的统计数据或多或少不存在)。
  3. 您是否已经对您所知道的多重相关技术进行了系统比较?

也可以随意评论上面给出的方法列表。


[1] 威尔科克斯,RR (1994)。百分比弯曲相关系数。心理测量,59,601-616。

4个回答

从心理学的角度来看,皮尔逊和斯皮尔曼的相关性似乎是最常见的。但是,我认为许多心理学研究人员在执行 Pearson 相关性之前对组成变量进行了各种数据处理程序。我想任何对稳健性的检查都应该考虑以下因素的影响:

  • 一个或两个变量的变换,以使变量接近正态分布
  • 根据统计规则或观察问题的知识调整或删除异常值

我会向您推荐我之前在此处发布的 2011 年《科学》杂志上发表的这篇出色的文章提出了一种新的稳健措施,并与其他措施进行了详尽而出色的比较。此外,所有措施都经过稳健性测试。请注意,这一新措施还能够识别数据中的多个功能关系,也能够识别非功能关系。

Kendall 的 tau 在 copula 理论中应用非常广泛,可能是因为它对于阿基米德 copula 来说是一件很自然的事情。Genest 和 Rivest 引入了累积的 Kendall tau 图,作为在双变量 copulas 族中选择模型的一种方式。

链接到 Genest Rivest (1993) 论文

一些可靠的相关性度量是:

  1. Spearman 等级相关系数

  2. Signum (Blomqvist) 相关系数

  3. 肯德尔的 Tau

  4. 布拉德利的绝对相关系数

  5. 舍夫利亚科夫相关系数

参考:

• Blomqvist, N. (1950) “关于两个随机变量之间依赖关系的度量”,《数理统计年鉴》,21(4): 593-600。• Bradley, C. (1985) “绝对相关性”,数学公报,69(447): 12-17。• Shevlyakov, GL (1997) “关于相关系数的稳健估计”,数学科学杂志,83(3):434-438。• Spearman, C. (1904) “两件事之间关联的证明和测量”,美国心理学杂志,15:88-93。