Local Moran's I 统计量 (LISA) 的 p 值调整

机器算法验证 r 多重比较 邦费罗尼
2022-03-08 00:58:44

我正在使用 spdep 包在 R 中进行一些探索性空间分析。

我遇到了一个选项来调整使用函数计算的局部空间关联指标 (LISA) 的p值。localmoran根据文档,它的目标是:

... 多个测试的概率值调整。

在我的文档中进一步p.adjustSP阅读,可用的选项是:

调整方法包括 Bonferroni 校正 ('"bonferroni"'),其中 p 值乘以比较次数。Holm (1979) ('"holm"')、Hochberg (1988) ('"hochberg"')、Hommel (1988) ('"hommel"') 和 Benjamini & Hochberg (1995) 还包括四个不太保守的修正('"fdr"'),分别。还包括一个传递选项(“无”)。

前四种方法旨在对全族错误率进行强有力的控制。似乎没有理由使用未修改的 Bonferroni 校正,因为它受 Holm 方法的支配,这在任意假设下也是有效的。

当假设检验独立或非负相关时,Hochberg 和 Hommel 的方法是有效的(Sarkar,1998;Sarkar 和 Chang,1997)。Hommel 的方法比 Hochberg 的方法更强大,但差异通常很小,而且 Hochberg p 值的计算速度更快。

Benjamini、Hochberg 和 Yekutieli 的“BH”(又名“fdr”)和“BY”方法控制错误发现率,即被拒绝假设中错误发现的预期比例。错误发现率是一个没有家庭错误率严格的条件,因此这些方法比其他方法更强大。

出现了几个问题:

  1. 简单来说——这次调整的目的是什么?
  2. 有必要使用这种更正吗?
  3. 如果是 - 如何从可用选项中进行选择?
1个回答

简而言之,您面临的问题称为多重假设检验顾名思义,当您同时测试许多假设时,它就会出现。

假设您有一个给定的概率错误地拒绝测试的原假设(假阳性),例如 5%。随着您增加正在测试的数据集的数量(在这种情况下,每个应用局部 Moran 统计量的集合),在任何数据集中观察到误报的概率都会增加,这与观察到的概率无关。单个数据集的误报是相同的。

有许多可能的“更正”,即您发现的,可以纠正这个问题;如果您确实需要本地统计信息,则无法回避。否则,您可以将全局统计数据用作单个假设。