重复测试累积数据时出现总体 I 型错误

机器算法验证 多重比较 临床试验 类型 i 和 ii 错误
2022-03-13 05:55:34

我有一个关于组顺序方法的问题。

根据维基百科:

在具有两个治疗组的随机试验中,以下列方式使用经典的组序贯测试:如果每组中有 n 名受试者,则对 2n 名受试者进行中期分析。进行统计分析以比较两组,如果接受备择假设,则终止试验。否则,对另外 2n 名受试者继续试验,每组 n 名受试者。对 4n 个受试者再次进行统计分析。如果接受替代方案,则终止试验。否则,它会继续进行定期评估,直到有 2n 个主题的 N 组可用。至此,进行最后一次统计检验,终止试验

但是通过以这种方式反复测试累积数据,第一类错误级别被夸大了......

如果样本彼此独立,则总体 I 型错误,α, 将会

α=1(1α)k

在哪里α是每个测试的级别,并且k是临时看的次数。

但是样本不是独立的,因为它们重叠。假设以相同的信息增量进行中期分析,可以发现(幻灯片 6)

在此处输入图像描述

你能解释一下这个表是如何获得的吗?

1个回答

下面的幻灯片,通过 14,解释了这个想法。正如您所注意到的,关键是统计数据的顺序是相关的。

上下文是具有已知标准偏差的 z 检验。第一次检验统计z1,适当标准化,具有正态 (0,1) 分布与 cdfΦ. 第二个统计也是如此z2, 但是——因为第一个使用了用于第二个的数据的子集——这两个统计量与相关系数相关1/2. 所以(z1,z2)具有双正态分布。I 类错误的概率(在原假设下)等于 (a) I 类错误在第一次测试中发生或 (b) I 类错误在第一次测试中没有发生但在第一次测试中发生的概率第二次测试。c=Φ1(10.05/2)是临界值(对于标称尺寸的两侧测试α= 0.05)。那么在两次分析后出现 I 类错误的机会等于|z1|>c或者|z1|c|z2|>c. 数值积分给出了这个概率的值 0.0831178,与表格一致。表中的后续值是通过类似的推理(以及更复杂的积分)获得的。

该图描绘了副法线 pdf 和积分区域(固体表面)。 双正态 PDF,3D 曲面图