我希望我对标题有意义。通常,零假设的形成是为了拒绝它。这是有原因的,还是只是一个约定?
为什么零假设经常被拒绝?
统计假设检验的目的主要是强加自我怀疑,使我们对发布我们的假设保持谨慎,除非有合理的证据支持它。因此,在假设检验的通常形式中,零假设提供了一个“魔鬼拥护者”,反对我们,并且只有在我们能够证明观察结果意味着拥护者的论点不太可能是合理的情况下,才会公布我们的假设。所以我们取成为我们不想成为真实的事物,然后看看我们是否能够拒绝它。如果我们可以拒绝它,并不意味着我们的假设很可能是正确的,只是它已经通过了这个基本的障碍,因此值得考虑。如果我们不能,这并不意味着我们的假设是错误的,可能是我们没有足够的数据来提供足够的证据。正如@Bahgat 正确建议的那样(+1),这在很大程度上是波普尔的证伪主义思想。
但是,可以有一个测试,其中是您希望为真的东西,但为了使其工作,您需要证明该测试具有足够高的统计能力,以便有信心拒绝 null 如果它实际上是错误的。计算统计能力比执行测试要困难得多,这就是为什么很少使用这种测试形式的原因,而是您不希望为真的替代方法。
因此,您不必采用来反对您的假设,但它确实使测试过程更加容易。
不认为 null 总是被拒绝是理所当然的。在模型拟合测试中,空值通常是模型拟合得很好,这是我们不愿拒绝的可取之处。然而,通常情况下,检验统计量的抽样分布更容易在零值下推导出来,这通常比替代方案更具限制性。两组之间的平均差为零的空值导致-测试; 两个分布相同的空值导致 Kolmogorov-Smirnov 检验;通过 Ramsey RESET 检验线性回归模型不需要非线性项的零值;潜在变量模型描述观察到的协方差矩阵的零值充分导致参数空间的维数低于无限制的替代方案,以及到模型定义的协方差。所以我对此的看法是,正如@whuber 在下面的评论中所说的那样,null 通常是一个至关重要的但方便的技术假设。空值要么是参数空间中的一个点(可能是多元的),因此完全指定了采样分布;或一个受限的参数空间,其备选方案可以被表述为在该空间中是互补的,并且检验统计量基于备选方案下的更丰富的参数集与在零下有限制的参数集的距离;或者,在非参数等级/顺序统计世界中,可以通过对所有可能的样本和结果的完整枚举来得出零值下的分布(尽管通常近似于大样本中的正常值)。
将零值视为不同的东西(例如,两组的均值最多相差 0.01,备选方案相差超过 0.01)需要一组更复杂的推导,例如,查看最坏的可能情况,其中上述情况仍然可以归结为针对片面替代方案的零点。右边最坏的情况是 vs.,左边是 vs.。
这是一个公平而好的问题。@Tim 已经为您提供了以正式方式回答问题所需的一切,但是,如果您不熟悉统计假设检验,您可以通过在更熟悉的环境中考虑零假设来概念化它。
假设你被指控犯罪。在被证明有罪之前,您是无辜的(零假设)。律师提供您有罪的证据(替代假设),您的律师在审判(实验)期间试图使该证据无效,最后法官根据律师和律师提供的事实裁定您是否无罪。如果对你不利的事实是压倒性的,即你是无辜的可能性非常低,法官(或陪审团)会根据证据认定你有罪。
现在考虑到这一点,您还可以概念化统计假设检验的特征,例如为什么独立测量(或证据)很重要,因为毕竟您应该得到公平的审判。
然而,这个例子有其局限性,最终你必须正式理解零假设的概念。
所以回答你的问题:
是的,零假设是有原因的(如上所述)。
不,这不仅仅是一个约定,零假设是核心或统计假设检验,否则它不会按照预期的方式工作。