为什么 I 类错误不受不同样本量的影响 - 假设检验?

机器算法验证 假设检验 样本量 可能性 类型 i 和 ii 错误
2022-03-18 06:04:37

我不明白为什么在执行假设检验时出现 I 类错误的概率不受影响。增加n 降低标准差使正态分布在真实处的尖峰更大,临界边界的面积应该减小,但为什么不是这样呢?µ

(交叉发布在Math Stack Exchange上。)

3个回答

这是一个不经常被问到的问题。在常客统计中,我们倾向于按照惯例固定然后作为类型 II 错误(即幂)即使我们也有很大的奢侈不允许我们选择不同的这么多误报。这种约定的结果是,当为“大”时,可以检测到微不足道的差异,而当有很多假设时,就会出现多重性问题。相比之下,似然推理学派倾向于处理 I 类和 II 类错误的总数,并让 I 类错误αn01nn0n. 这解决了频率论范式的许多问题。具有讽刺意味的是,似然法的常客性能特征也相当不错。

参见例如http://people.musc.edu/~elg26/SCT2011/SCT2011.Blume.pdfhttp://onlinelibrary.wiley.com/doi/10.1002/sim.1216/abstract

您似乎错过了 I 类错误率也是您的截止标准的要点。如果您的截止标准没有改变,那么 alpha 不会改变。

值是在 null 为真时观察到的效果与您发现的效果一样大或更大的条件概率如果您选择 0.05 的截止值来确定 null 不为真,那么它为真的 0.05 概率将变成您的 I 型错误。pp

顺便说一句,这突出了为什么您不能进行相同的测试并为设置截止值。才能存在。ββ

弗兰克哈雷尔的观点非常好,这取决于你的哲学。尽管如此,即使在频率统计下,您也可以提前选择较低的标准,从而改变 I 类错误的发生率。

如果您使用标准假设检验,那么您将设置置信水平,然后将检验 p 值与其进行比较。在这种情况下,样本量不会影响 I 类错误的概率,因为您的置信水平是 I 类错误的概率,几乎可以定义为换句话说,您通过选择置信水平来设置 I 类错误的概率。αα

I 类错误的概率仅受您选择的置信水平的影响,而没有其他影响。