使用 p 值和置信区间进行假设检验的差异

机器算法验证 假设检验 置信区间 p 值 部分 z检验
2022-04-15 07:08:59

我有一个简单的问题

样本人口为 384 人,12其中 % 的人患有疾病。假设是5% 的实际人口患有疾病。所以,H0:μ=0.05Ha:μ0.05

首先,我计算 Z 统计量。

z=p^pp(1p)/384=0.120.050.05(10.05)/384=6.3

使用 p 值来检验假设(我使用了 R 2*(1-pnorm(6.3))):

2Φ(|6.3|)=2.976457e10
小于 0.05 显着性水平,因此拒绝 Null。

使用显着性水平为 0.05 的置信区间:

p^±zp^(1p^)/384=0.12±6.30.12(10.12)/384I get the following0.0155<0.05<0.224

因此,根据置信区间,我不能拒绝 Null。是我做错了什么,还是有时两种方法之间存在分歧?当然,在某些情况下 CI 和 p 值不同意我应该选择哪一个?谢谢。

3个回答

与大N,您的检验统计量将按正态分布。因此,我们可以将您的测试统计量称为“z",我们也可以使用"z" 指的是渐近抽样分布。但是,这些并不相同z的。当你形成你的1α%置信区间,您需要将标准误差乘以z1α/2获得正确的增量。然后,您从观察到的百分比中添加(减去)乘积以获得置信限。例如,如果你想要一个95%置信区间,您将标准误差乘以z.975=1.96. 如果您使用此值,您的置信区间为:

p^±z1α/2×p^(1p^)N=0.12±1.96×0.12(10.12)384=0.0872<0.12<0.15
这与您的假设检验一致。

我没有代表发表评论,但我看到该问题存在一些缺陷。首先,6.3 sigma 远远超过 0.95 CL 只需快速应用 Chebyshev 定理。置信水平表示“在 N 次实验中,如果至少 1 - p 次实验你得到零假设,你不能拒绝它”。

然后,二项分布不是对称的,但是有足够的观察结果,所以如果你做一个直方图,它看起来是对称的。

为了掌握这个概念,我一直在研究几个情节来说明为什么zstatistic 计算总体理论比例的预期标准误差(可以说是从零假设的角度),然后计算出这些标准误差中有多少适合从理论总体比例到样本比例的距离 - 在这个案子~6- 如图所示,用六个箭头将总体与样本比例分开:

在此处输入图像描述

以及为什么,另一方面,置信区间做同样的事情,但是从可能的替代假设的角度来看,或者换句话说,从样本均值的角度来看:它是在样本中找到的用于计算标准的比例错误后面的计算绘制为置信区间,显示为远离样本比例的发散箭头,并覆盖两侧的两个标准误差置信区间):

在此处输入图像描述

无论哪种情况,结论都是一样的:拒绝Ho有利于Ha:μ0.05.

此处的插图代码。