试图理解假设检验中的不对称性

机器算法验证 假设检验
2022-03-26 13:38:31

我需要对统计假设检验有一个了解。在典型的假设检验中,我们有 2 个相反的假设;即 Null 和 Alternative。在这里,我的教科书说“这两个假设是不对称的,如果我们交换假设,那么结果就会改变”。

在这里,我无法理解那本教科书要说的重点。有人可以详细给我解释一下吗?如果有人也能举出一些不对称的例子,那将会很有帮助。

感谢你的帮助。

谢谢,

2个回答

假设您有一个未流通的美国双鹰金币的随机样本,您已对其进行了金含量分析。尽管制造差异使美国铸币厂无法保证每只双鹰都含有正好0.9675 金衡盎司的黄金,但铸币厂试图将其作为平均值来实现。 如果他们成功了,你的样本中的权重分布应该集中在这个值附近。远离 0.9675 的样本平均值(与您的测量值的分布相比)将证明这些硬币不是诚实的双鹰。

在此示例中,零假设是双鹰的种群平均为 0.9675 盎司,而另一种情况是平均值与 0.9675 不同。假设您要交换这两个语句,而是尝试测试总体均值是否不同于0.9675。你不能用数据检验这个假设,因为(字面上)任何一组值都会与它一致。(如果您在每次测定中总是获得 0.9675,那么您的测量程序本身就会受到质疑,因为结果会过于一致!) 这两个假设之间存在固有的、深刻的、不对称性,因为其中一个对关于数据如何分布,而另一个则没有。

假设检验还有另一个不对称性。在同样的情况下,您可能有兴趣评估美国双鹰的种群是否体重过轻。足够的样本平均值将很好地证明这一点。但是,平均值必须大大低于 0.9675:测试的“临界值”要低多少。在这种情况下,您可以切换零假设和替代假设。新的空值是美国双鹰的种群超重。足够高的样本平均值将是很好的证据。但是,该平均值必须大大高于 0.9675:此反向测试的临界值要高多少。在每种情况下,可能的样本平均值集都分为两部分:小于临界值的部分和大于临界值的部分。因为两个临界值不相同,所以分区也不同。例如,在第一种情况下,样本平均值足够低可以让您得出总体均值过轻的结论,但在第二种情况下,它与总体均值未超重的原假设一致。 注意与假设一致的证据和证伪假设的证据之间的区别 这种不对称性是假设检验逻辑中固有的。

我怀疑这意味着如果您对 H1 进行空 H0 测试并且无法拒绝原假设,这并不意味着如果您以 H1 作为空值对 H0 进行测试,您将能够拒绝 H1 .

原因是未能拒绝原假设并不意味着原假设是正确的,它可能只是意味着没有足够的数据可以确信原假设是错误的。