假设检验。为什么将抽样分布集中在 H0 上?

机器算法验证 假设检验 置信区间 p 值
2022-03-28 07:20:13

当假设零假设 ( ) 为真时,p 值是获得至少与样本数据中观察到的统计量一样极端的统计量的概率。H0

时获得的抽样分布下的样本统计量定义的区域H0

中心 h0

然而,因为这个假设分布的形状实际上是基于样本数据的,所以将它集中在对我来说似乎是一个奇怪的选择。 如果改为使用统计量的抽样分布,即以样本统计量为中心,那么假设检验将对应于估计给定样本μ0
μ0

中心 h1

在这种情况下,p 值是在给定数据而不是上述定义的情况下获得至少与μ0

此外,这种解释具有与置信区间概念很好地关联的优点:
具有显着性水平的假设检验将等效于检查是否落在抽样分布的置信区间内。αμ0(1α)

CI2 95

因此,我认为将分布集中在上可能是不必要的复杂化。 这一步有什么我没有考虑的重要理由吗?μ0

3个回答

然而,因为这个假设分布的形状实际上是基于样本数据的,所以将它集中在 H0 上对我来说似乎是一个奇怪的选择。

这实际上是不正确的。这种假设分布的形状来自于接受为真。H0除了一些假设之外,Sample 并不直接参与其中。直接使用样本是不够的。您还需要保持原假设。

如果人们改为使用统计量的抽样分布,即以样本统计量为中心分布,那么假设检验将对应于估计给定样本的 H0 概率。

问题是:你如何估计你认为是真的某件事的概率。在我们的例子中,如果你假设为真,那么试图估计为真的概率是徒劳的。H0H0

因此,我认为将分布集中在 H0 上是不必要的复杂化。

你那里没有两个分布,只有一个,一个假设是你的基本事实,也就是附带的那个。然而,有一个从样本派生的抽样分布,但这与您使用的假设无关。H0

我很好的练习是尝试用非对称分布复制相同的逻辑。像卡方独立性检验一样采用卡方分布。你能重现它吗?我认为答案是否定的。

假设和已知方差的正态分布中抽取的样本因此,样本均值与均值和方差是正常的。在这一点上,我认为不可能有分歧。X=(X1,X2,,Xn)μσ2X¯μσ2/n

现在,您建议我们的检验统计量是 对? 但这不是一个统计数据为什么?因为是一个未知参数统计量是不依赖于任何未知参数的样本函数。因此,为了使成为统计量,必须对一个这样的假设是写其中一个统计量。

Z=X¯μσ/nNormal(0,1).
μμZ
H0:μ=μ0,vs.H1:μμ0,
ZH0=X¯μ0σ/nNormal(0,1),

相比之下,您建议使用本身。在这种情况下,相同,它甚至不是随机变量,更不用说正态分布了。没有什么可以测试的。μ=X¯Z=0

据我所知,您认为“翻转”更有意义。H0H1

我发现将假设检验视为矛盾的证明是有帮助的。我们假设为真,然后证明有证据表明这种假设是有缺陷的,从而证明拒绝支持是合理的。H0H0H1

这是有效的,因为当我们假设并将我们的分布集中在那里时,我们可以确定我们观察到的可能性/不可能性。例如,如果 vs. 并且我们从测试中确定真实均值实际上等于 0 的可能性小于 5%,我们可以用 95拒绝% 信心。H0H0:μ=0H1:μ0μH0

反过来不一定正确。假设我们做了一个实验,并确定实际上有 30% 的机会仍然存在原假设。我们不能拒绝 null,但我们也不接受它这种情况并没有表明(null)是真的,而是我们没有证据表明它是假的。H0

现在想象一下,如果我们翻转这种情况。假设我们假设并发现根据我们的结果,的可能性为 5% 或更少,这意味着什么?当然我们可以拒绝空值,我们可以接受吗?很难证明接受我们一开始就认为是正确的事情是合理的。H1H0H1

显示为假并不是我们想要的结果;我们想支持通过按照您描述的方式进行测试,我们表明我们没有证据表明是真的有细微的不同。H0H1H1H1