我教授统计学概论,并想向我的学生展示如何分析辉瑞公司的第 3 阶段疫苗结果。使用辉瑞公司的数据测试关于 2 个比例的声明很简单:
鉴于:
- 组(1)是安慰剂组;
- 组(2)是疫苗组
数据:
接种第二剂疫苗的人数为 41,135 [A]。假设人们从安慰剂组和疫苗组中同等退出,这些组以 1:1 的比例创建[B]。所以我们每组大约有 20,567 人。使用 [A] 中发布的每个组中感染 covid 的人数,我们有:
安慰剂组: ,
疫苗组(BNT162b2): ,
宣称:
测试统计:
因此,我们有证据证明这意味着我们有证据证明疫苗与对照组相比降低了新冠病毒感染率。
到目前为止,一切都很好。但这就是事情崩溃的地方。制造商声称该疫苗的有效率为 95%。如果我一般用162作为预期病例数,那么如果疫苗有95%有效,疫苗组应该少于预期病例数的5%。162 例中的 5% 是 20567 年预计的 8.1 例。
控制组:
实验组:
宣称:
测试统计:
这显然是失败的,这意味着 P 值为 0.4901,我没有表明疫苗组的病例数少于预期病例数的 5%。为什么这个分析有缺陷?这似乎与(94.5% 有效意味着什么?)有关,但即使阅读此引文,我也不清楚为什么我的假设检验是错误的。再次,请提供适合统计类介绍的解释。
更新:如果我以 16.2 例而不是 8.1 例的期望重做分析,那么我得到的 p 值为 0.0477。这表明我可以以 5% 的显着性水平声称疫苗的有效率为 90%。问题只是他们可以进行更详细/复杂的分析以达到 95% 的效率,还是我的分析有缺陷而我很幸运?