我不明白为什么在执行假设检验时出现 I 类错误的概率不受影响。增加 降低标准差使正态分布在真实处的尖峰更大,临界边界的面积应该减小,但为什么不是这样呢?
(交叉发布在Math Stack Exchange上。)
我不明白为什么在执行假设检验时出现 I 类错误的概率不受影响。增加 降低标准差使正态分布在真实处的尖峰更大,临界边界的面积应该减小,但为什么不是这样呢?
(交叉发布在Math Stack Exchange上。)
这是一个不经常被问到的问题。在常客统计中,我们倾向于按照惯例固定。然后作为类型 II 错误(即幂)即使我们也有很大的奢侈不允许我们选择不同的这么多误报。这种约定的结果是,当为“大”时,可以检测到微不足道的差异,而当有很多假设时,就会出现多重性问题。相比之下,似然推理学派倾向于处理 I 类和 II 类错误的总数,并让 I 类错误为. 这解决了频率论范式的许多问题。具有讽刺意味的是,似然法的常客性能特征也相当不错。
参见例如http://people.musc.edu/~elg26/SCT2011/SCT2011.Blume.pdf和http://onlinelibrary.wiley.com/doi/10.1002/sim.1216/abstract。
您似乎错过了 I 类错误率也是您的截止标准的要点。如果您的截止标准没有改变,那么 alpha 不会改变。
值是在 null 为真时观察到的效果与您发现的效果一样大或更大的条件概率。如果您选择 0.05 的截止值来确定 null 不为真,那么它为真的 0.05 概率将变成您的 I 型错误。
顺便说一句,这突出了为什么您不能进行相同的测试并为设置截止值。才能存在。
弗兰克哈雷尔的观点非常好,这取决于你的哲学。尽管如此,即使在频率统计下,您也可以提前选择较低的标准,从而改变 I 类错误的发生率。
如果您使用标准假设检验,那么您将设置置信水平,然后将检验 p 值与其进行比较。在这种情况下,样本量不会影响 I 类错误的概率,因为您的置信水平是 I 类错误的概率,几乎可以定义为。换句话说,您通过选择置信水平来设置 I 类错误的概率。
I 类错误的概率仅受您选择的置信水平的影响,而没有其他影响。