给定两个(数字)样本,我想表明这两种方法之间没有显着差异和。
如果我的目标是显示显着差异,我将按如下
(1) vs
我在学校了解到,零假设应该始终代表“共同”信念,而替代假设应该代表我想展示的变化。
那么,如果我的目标是证明两种方法之间没有显着差异,我应该这样制定测试吗?
(2) vs
或者我可以使用第一个测试(1)并且当我无法拒绝零假设时说没有显着差异?
给定两个(数字)样本,我想表明这两种方法之间没有显着差异和。
如果我的目标是显示显着差异,我将按如下
(1) vs
我在学校了解到,零假设应该始终代表“共同”信念,而替代假设应该代表我想展示的变化。
那么,如果我的目标是证明两种方法之间没有显着差异,我应该这样制定测试吗?
(2) vs
或者我可以使用第一个测试(1)并且当我无法拒绝零假设时说没有显着差异?
您不能以您描述的方式使用第一个测试,因为在第一个测试中未能拒绝仅表示您无法拒绝仅此而已。就像只收到“检察官无法向陪审团提供足够证据以确保定罪”的信息——这并不能告诉你嫌疑人是无辜的。
第二个测试在实践中是不可用的,因为无论你有多少数据,你都不能排除非常小的差异的可能性。
您可以做的是查看
即尝试拒绝差值的绝对大小大于某个差值的原假设。以便任何小于该值的差异对于所有(或您的特定)实际目的都无关紧要。
我在学校了解到,零假设应该始终代表“共同”信念,而替代假设应该代表我想展示的变化。
这不是对原假设的准确解释。零假设只是一个假设,它由可以计算概率的特定分布组成。我们使用作为原假设的原因与这是否是“常见”信念无关。它被用作零假设,因为如果我们假设平均值是一个特定值,那么给定一组特定的数据,我们可以计算看到该数据的概率。我们不能使用作为我们的零假设,因为没有办法仅仅基于均值不等于特定值的假设来计算 p 值。考虑以下问题:
苹果的重量标准差为 5 克。均值不等于 100。看到一个重 110 克的苹果的概率是多少?
没有办法回答这个问题,因为仅仅被告知平均值不足以计算概率。
Björn 建议检验均值差异大于某个的假设。这将如何工作是采用零假设,因为差异恰好等于。然后,一旦有了数据,就可以计算给定的 p 值。称之为。如果样本均值的差异小于 ,那么如果我们选择大于 delta_0 ,则 p 值甚至会小于。如果 p 值小于,我们拒绝 null ,所以如果我们在那个 null 下拒绝,这意味着。由于对于任何,我们可以得出结论对于任何。因此,我们不仅可以拒绝的这个空值,而且我们可以拒绝任何具有更大的空值。正是因为这种获得 p 上界的能力,我们才不需要的特定值。如果我们只是将“大于零”作为我们的零假设,而没有任何下限,那么 p 就没有上限,因此我们不能得出它低于的结论。