“自由”p值?

机器算法验证 假设检验 统计学意义 p 值 术语 类型 i 和 ii 错误
2022-03-16 22:31:52

我的问题相当语义化。当一种方法经常产生高 p 值时,它被称为保守的。你会称之为相反的,即一种具有高II型错误率的方法吗?

2个回答

根据这个主页,通常使用这个术语。

统计学中的保守主义与其他领域具有相同的一般含义:通过谨慎行事来避免过度。在统计学中,“保守”特指在假设检验、检验结果或置信区间时保持谨慎。保守地报告意味着您不太可能提供错误信息。

可以在以下意义上指定:

保守检验始终保持拒绝原假设的概率远低于显着性水平。假设您正在运行一个假设检验,您将 alpha 水平设置为 5%。这意味着测试将(错误地)在 20 次中给你一个显着的结果。这称为第一类错误率。保守的测试将始终将 I 类错误率控制在远小于 5% 的水平,这意味着您出错的机会将远低于 5%(可能为 2%)。*


但是,我建议您使用其他术语,例如权力的定义。如果假设检验在您的术语中是“自由的”,则它具有更大的效力。如果假设检验在您的术语中是“保守的”,则它的效力较小。根据我的经验,“自由主义假设”一词在实践中几乎没有使用,即使您的听众由统计学家组成,您的听众也可能听起来不常见。




在下面的段落中,我解释了为什么“保守”和“自由”并不总是政治上的确切区别。因此,我不建议在统计中使用自由主义作为保守主义的对立面。如果对您没有帮助,请随意忽略这部分

请注意,在政治学中,自由主义不一定是保守主义的对立面。在美国,像伯尼·桑德斯这样的左翼政客被称为自由主义者,但在欧洲的许多地方,例如德国、荷兰和丹麦,情况就不同了。在德国政治中,自由主义主要被理解为政治自由的最大化,尤其是在经济学中。德国自由党 (FDP) 在许多问题上比社会主义者更偏右翼,尽管他们支持 LGBT 权利和大麻合法化等问题。当您提到“自由政治”时,一些德国人可能会想到美国所谓的自由主义者。在丹麦和荷兰,情况更加复杂。你有两个自认为是自由派的大党——在荷兰“VVD”和“D66”;在丹麦的“Vestre” 和“Radicale Vestre”。虽然“VVD”和“Vestre”相当“右翼”,但“D66”和“Radicale Vestre”相当左翼。

出于这个原因,在与全球国际观众交谈时,您不应该使用术语:“保守统计测试”和“自由统计测试”。


PS:我希望我的政治立场保持在这个话题之外,并中立地解释它。

这个问题声称“当一种方法经常产生高 p 值时,它被称为保守的。” 正如@Accumulation 在评论中指出的那样,p 值具有精确的定义。一个人没有或多或少的保守 p 值。在实践中,有时必须估计一个 p 值(例如,通过使用引导程序),我想可以将这种估计器描述为“保守的”。但我在实践中没有看到这一点,我认为这不是问题所在。

尽管我手头没有参考资料,但如果一个假设检验的类型 1 错误较小,那么将其称为比另一个更保守似乎很自然。在相反的意义上使用自由主义似乎是可能的,尽管我不记得在任何地方看到过。

术语“保守”通常用于置信区间。根据参数的真实值,95% 置信区间程序将具有不同的覆盖概率。例如,在 Brown 等人的二项式比例的区间估计中,谈到伯努利概率 p 的两个不同置信区间,他们说“[Agresti-Coull] 区间的覆盖概率对于 p 非常接近是相当保守的到 0 或 1。与威尔逊区间相比,它更保守,尤其是对于小 n。说 p 非常接近 0 或 1 是保守的,意味着对于 p 接近 0 或 1,区间包含 p 的真实值的概率将非常高——高于区间的标称覆盖率(比如 95% )。