分析辉瑞疫苗功效:测试关于 2 个比例的声明

机器算法验证 新冠肺炎
2022-03-27 09:46:06

我教授统计学概论,并想向我的学生展示如何分析辉瑞公司的第 3 阶段疫苗结果。使用辉瑞公司的数据测试关于 2 个比例的声明很简单:

鉴于:

  • 组(1)是安慰剂组;
  • 组(2)是疫苗组

数据:

接种第二剂疫苗的人数为 41,135 [A]。假设人们从安慰剂组和疫苗组中同等退出,这些组以 1:1 的比例创建[B]。所以我们每组大约有 20,567 人。使用 [A] 中发布的每个组中感染 covid 的人数,我们有:

安慰剂组: x1=162, n1=20,567

疫苗组(BNT162b2): x2=8, n2=20,567

宣称: p1>p2p1p2>0

H0:p1p20
H1:p1p2>0

测试统计:z=11.8P-Value<0.0001

因此,我们有证据证明p1>p2这意味着我们有证据证明疫苗与对照组相比降低了新冠病毒感染率。

到目前为止,一切都很好。但这就是事情崩溃的地方。制造商声称该疫苗的有效率为 95%。如果我一般用162作为预期病例数,那么如果疫苗有95%有效,疫苗组应该少于预期病例数的5%。162 例中的 5% 是 20567 年预计的 8.1 例。

控制组: x1=8.1,n1=20,567

实验组: x2=8,n2=20,567

宣称: p1>p2p1p2>0

H0:p1p20
H1:p1p2>0

测试统计:0.0249P-Value=0.4901.

这显然是失败的,这意味着 P 值为 0.4901,我没有表明疫苗组的病例数少于预期病例数的 5%。为什么这个分析有缺陷?这似乎与(94.5% 有效意味着什么?)有关,但即使阅读此引文,我也不清楚为什么我的假设检验是错误的。再次,请提供适合统计类介绍的解释。


更新:如果我以 16.2 例而不是 8.1 例的期望重做分析,那么我得到的 p 值为 0.0477。这表明我可以以 5% 的显着性水平声称疫苗的有效率为 90%。问题只是他们可以进行更详细/复杂的分析以达到 95% 的效率,还是我的分析有缺陷而我很幸运?

1个回答

根据评论,此分析存在几个问题。首先,分析基于能够将二项式近似为正常。我查阅过的教科书以不同的方式写了这个要求。Sullivan(统计学基础)说,除了是二项式之外,每个组都必须通过np(1p)10为有效。对于对照组,此要求得到满足。对于实验组来说不是。Triola(基本统计)说要求是 np5nq5对于两组中的每一个。两组均满足此要求。

其次,第二个分析还取决于对照组是对实验组预期病例数的估计。这种假设是不准确的,并且可能导致疫苗看起来不如实际有效。

最后,对于置信区间,教科书再次给出了不同的要求(np(1p)10对比np5nq5)。只有其中一些要求得到满足,这表明我们在这个分析的有效性上处于毛茸茸的边缘。因此,关于感染新冠病毒的比例的粗略猜测是(1.6%8.2%)。

对我来说,这意味着我们可以做一些基本的分析,但这必须持保留态度,因为案例的数量仍然足够少,不足以满足要求。

最后,感谢对这篇文章发表评论的人,因为他们帮助我更深入地思考正在发生的事情