对于离散检验统计量,对应的分布-值是离散的并且随机地大于均匀分布。因此,基于 p 值的相应假设检验(例如,如果 p 值小于 0.05,则拒绝)在犯 I 类错误的概率小于 0.05 的意义上总是保守的。我知道有时建议使用中间值。但我认为没有证据表明使用中间 pvalue 仍然可以控制 I 类错误。有没有其他方法可以减少保守性?任何熟悉该领域的人都可以给出一些提示或指出一些现有的文献吗?
基于离散随机变量的测试的保守性
我从未听说过建议使用中间 p 值。这不一定会控制您的第一类错误。如前所述,达到0.05大小的正确方法是执行随机测试。但是,无论测试是否随机,您的第一类错误都是正确的。在保守的非随机情况下,您的测试程序的大小小于标称 alpha 水平。由于 0.05 的 alpha 水平无论如何都是任意的,因此报告测试的大小应该足够了。
一种降低某些离散检验统计量保守性的方法
(或更一般地说,只是获得更多显着性水平的选择)
根据测试,一种不需要随机化的偶尔有用的方法是添加另一个合理统计数据的一小部分来打破平局。
例如,假设我们正在测试 Kendall 的 tau,但在中小型样本中,它仍然非常离散,因此很难达到接近所需的显着性水平。
具体而言,假设您想要一个接近于在双尾测试中,与.
可达到的显着性水平为 6.9% 或 13.6%;两者都不是非常接近需要的!
我们可以做的一件事是添加一个不同统计数据的一小部分,一个与我们拥有的数据不完全相关的数据;这意味着许多提供以前绑定的统计数据的安排不再绑定,即使它们的值很接近。
例如,如果我们使用 Spearman 的 rho 来打破关系,例如通过查看,值几乎与以前相同,但可实现的显着性水平现在分别为 8.9% 和 10.9% - 不完美,但比以前好得多 - 在这种情况下,统计数据仍然是无分布的。
注意重量在可以根据需要制作得尽可能小。
这是一个插图 - 黑色是原始 Kendall 相关性的 ECDF,而红色是“break ties”版本。我在这里使 Spearman 的相对贡献更大(权重为 0.1),因此您可以更清楚地看到效果:
让我们放大左端 2.5% 和 5% 水平附近的区域(一尾,对应 5% 和 10% 双尾):
正如我们所看到的,我们可以通过这种方式更接近所需的显着性水平,同时将几乎所有其他所需的属性保留到我们希望的任何接近程度。
有各种调整可以使结果更像 Kendall(例如,设置它以便在每个 Kendall 相关性处对 Kendall 相关性进行小幅调整的预期为零,但这对我来说很少是问题)。
[如果你真的不知道你想使用 Kendall 和 Spearman 中的哪一个来进行非参数相关,那么更均匀的混合具有更正常的分布(尽管如果你不知道它的方差有点棘手计算出准确的分布 - 使用几乎所有一个或另一个统计数据的版本的一个很好的特点是你可以更容易地使用现有的正态近似值,即使它不是一个很好的分布)。]
这种获得“更好”显着性水平(和 p 值)的方法可以与其他测试一起使用;例如,我已经看到它与符号测试一起使用(与适当重新调整的符号等级统计数据打破关系)。