我正在阅读假设检验中的决策错误。我的问题是为什么“Type-II 错误”被认为是一个错误?据我了解,当我们未能拒绝错误的零假设时,就会出现这种情况。当我们未能拒绝零假设时,这仅仅意味着我们没有强有力的证据来拒绝它。我们不会对这两个假设中的哪一个是正确的(或错误的)做出任何评论——任何一个都可以是正确的。我们并不是说零假设是正确的。因此,为什么这样的结论称为错误?
为什么假设检验中的 II 型错误被认为是错误?
机器算法验证
假设检验
统计学意义
p 值
2022-03-29 14:27:02
3个回答
这是因为当备择假设为真时,我们没有做我们应该做的事情。例如,我们没有使用实际上比现有药物更好的新药,但我们无法证明这一点。
我们如何使用“错误”这个词最终是一个语义问题,理性的人可能会不同意我们是否应该以及在什么意义上应该将假阴性视为错误。
- 一方面,我认为你是对的,一个不显着的结果实际上只是意味着我们没有足够的信息来确信原假设是错误的,并且这在逻辑上并不意味着原假设是正确的( cf.,为什么统计学家说一个不显着的结果意味着“你不能拒绝零”而不是接受零假设?)。因此,考虑到您对您的情况所需的信心水平和数据的模糊程度,您在正确应用您已决定的规则的意义上做出了正确的决定。
- 另一方面,如果您将自己置于计划学习的人的位置。他们想知道 null 是否为假。如果它真的是假的,他们想在研究完成后拒绝零假设后离开。相反,他们仍不清楚这个问题,可能不得不设计和进行另一项研究。从这个角度来看,不拒绝一个错误的空值绝对是一个次优的结果。
“失败”这个词接近“错误”。
对我来说,错误这个术语是有意义的,因为您可以计算它发生的概率(前提是您设置了需要检测的某个最小效应大小)。你想在你希望它很小的情况下计算这个概率。在这些情况下,失败将被视为错误。
对我来说,它与 I 型错误非常对称。
与与 I 类错误相关的 p 值一样,您还可以计算(错误地)不拒绝原假设的概率。对于给定的影响大小和给定的测试(例如测量次数),您可以计算这种“失败”可能发生的概率。
这些想法确实需要您为零假设设置一个边界。
在被 p 值、显着性和假设检验(反也可以通过将重点放在碰巧是显着的次要影响上,仅通过大量测量来实现)。如果比一些大然后效果被说/认为不存在(或更优雅地不显示存在)。无论如何,它肯定会影响我们未来的行动,就好像我们接受了.