第一类错误和第二类错误权衡

机器算法验证 假设检验 统计学意义
2022-03-27 04:53:29

有人可以借助图表和直观的解释来说明权衡吗?谢谢

3个回答

当男孩第一次假装有一只狼并且村民们相信他时,这是第一类错误。当他再次声称有狼,但没有人认真对待他时,虽然这是真的,但这是第二类错误。

村民们可以通过不相信男孩来避免第一类错误,但是当有狼在身边时,这总是会导致第二类错误。同样,他们总是可以相信他,永远不会犯第二类错误,但这会导致很多第一类错误。

您可以将男孩的害怕程度视为一种检验统计量。如果他在哭,他的呼吸和心跳加快,他起鸡皮疙瘩或竖起毛(他的头发都竖起来了),那么村民们应该更认真地对待他的说法。要求所有这些症状都存在并且很高,类似于在@slowloris 发布的图表中使用一个小α

统计错误的生死存亡示例

你是一名护理人员,你接近车祸现场。一名受害者一动不动地躺在路上,您必须评估受害者是死是活,受害者将得到相应的处理。根据这些信息,哪个错误率会导致代价最高的错误?

零假设- 受害者的身份等于活着的人
替代假设- 受害者的身份不等同于活着的人(即他们已经死了)

I 类错误——当原假设为真时,你拒绝原假设。
II 型错误- 当备择假设为真时,您未能拒绝原假设。

I 类错误的成本- 您错误地假设受害者已经死亡,并且他们没有接受救护车到医院进行挽救生命的治疗。
II 类错误的成本- 您错误地将死者用救护车送往医院。

答:如您所见,第一类错误的成本比第二类错误的成本要低得多。

因此,您可以考虑权衡这些错误。在传统的统计假设检验中,您可以在进行实验之前使用这种成本效益分析来确定您的alpha(I 类错误率)和​​beta(II 类错误率)。在我们的示例中,我们需要一个非常小的 alpha(通常为 0.05),但可以使用更大的 beta(通常为 0.1 - 0.3,但在这种情况下我们可以使用 >0.3)。例如,这会极大地影响您的实验所需的样本量,因为您可以错误地接受原假设并报告死者实际上还活着。

在诊断测试中,我们可以根据我们在来自两个群体的测量分布之间设置的阈值来权衡 I 型和 II 型错误。使用我们的示例,我们可以测量皮肤的发红程度,较红的皮肤代表活着的受害者。

在图中,我们可以看到在这些组之间放置阈值的最佳位置是在两个分布之间的最低点。该位置将导致最小的总体误差。但是,我们可以在此进行合乎逻辑的权衡:通过将阈值向右移动,I 类错误的概率会降低,但会以 II 类错误的概率增加为代价。在我们的示例中,这种权衡是好的,可能会挽救某人的生命和我们作为护理人员的工作。

在此处输入图像描述

图片来源: http: //grasshopper.com/blog/the-errors-of-ab-testing-your-conclusions-can-make-things-worse/

谷歌“插图类型 1 类型 2 错误”,任君挑选。该站点是您可以找到与您要求的图形类似的众多站点之一。