中期分析是在研究正式结束之前的一个或多个时间点的数据分析,目的是例如可能提前终止研究。
根据 Piantadosi, S.(临床试验 - 方法论观点)的说法:“早期终止试验时,对治疗效果的估计会有偏差。决定越早,偏差越大。 ”
你能解释一下这个说法吗?我可以很容易地理解准确性会受到影响,但是关于偏差的说法对我来说并不明显......
中期分析是在研究正式结束之前的一个或多个时间点的数据分析,目的是例如可能提前终止研究。
根据 Piantadosi, S.(临床试验 - 方法论观点)的说法:“早期终止试验时,对治疗效果的估计会有偏差。决定越早,偏差越大。 ”
你能解释一下这个说法吗?我可以很容易地理解准确性会受到影响,但是关于偏差的说法对我来说并不明显......
首先,您必须注意上下文:这仅适用于由于临时监测显示有效/无效而提前停止试验的情况,而不是出于某种随机的外部原因。在这种情况下,效应大小的估计将在完全统计意义上存在偏差。如果你为了疗效而停止,估计效果会太高(假设它是积极的),如果你因为徒劳而停止,它会太低。
Piantodosi 也给出了直观的解释(我的版本中的第 10.5.4 节)。假设两个均值的真实差异为 1 个单位。当您进行大量试验并在中期分析时查看它们时,其中一些会观察到效果大小远高于 1,一些远低于 1,大多数在 1 左右 - 分布将很宽,但对称。此时估计的效果大小不会很准确,但不会有偏见。但是,如果差异显着(针对多次测试进行了调整),您只会停止并报告效应大小,即估计值偏高。在所有其他情况下,您继续前进并且不报告估算值。这意味着以提前停止为条件,效应大小的分布是不对称的,其期望值高于估计的真实值。
这种影响在早期更严重的事实来自于停止试验的更大障碍,因此在调节过程中分配的大部分被丢弃。
这是一个说明偏见如何在结论中产生的说明,以及为什么它可能不是完整的故事。假设您对一种药物进行了连续试验,该药物预计会产生积极 (+1) 的影响,但可能会产生消极的影响 (-1)。五只豚鼠一个接一个地进行测试。单个案例中正面结果的未知概率实际上是和负面结果。
所以经过五次试验后,不同结果的概率是
Outcome Probability
+5-0 = +5 243/1024
+4-1 = +3 405/1024
+3-2 = +1 270/1024
+2-3 = -1 90/1024
+1-4 = -3 15/1024
+0-5 = -5 1/1024
所以总体积极结果的概率是 918/1024 = 0.896,平均结果是 +2.5。除以 5 次试验,每次试验的平均结果为 +0.5。
这是一个无偏的数字,因为它也是。
假设为了保护豚鼠,如果在任何阶段累积结果为负,则终止研究。那么概率就变成了
Outcome Probability
+5-0 = +5 243/1024
+4-1 = +3 324/1024
+3-2 = +1 135/1024
+2-3 = -1 18/1024
+1-2 = -1 48/1024
+0-1 = -1 256/1024
所以总体积极结果的概率是 702/1024 = 0.6855,平均结果是 +1.953。如果我们在前面的计算中查看每次试验结果的平均值,即使用、、、 ,和那么我们将得到 +0.184。
这些是通过在第二种方案中提前停止而存在偏差的感觉,并且偏差在预测的方向上。但这还不是全部。
为什么胡伯和概率逻辑认为提前停止应该产生公正的结果?我们知道第二个方案中试验的预期结果是+1.953。预期的试验次数是 3.906。因此,将一个除以另一个我们得到 +0.5,与之前完全一样,并且被描述为无偏见。
好吧,我对此的了解来自 2008 年的 Harveian 演说http://bookshop.rcplondon.ac.uk/details.aspx?e=262从 本质上讲,据我所知,结果将偏向于 1) 提前停止通常意味着治疗比预期的效果或多或少,如果这是积极的,那么您可能正在利用机会。我相信 p 值是根据计划的样本量计算的(但我可能错了),而且如果您不断检查结果以查看是否显示了任何影响,则需要纠正多重比较为了确保您不只是在寻找机会效应。例如,如果您检查 20 次 p 值低于 0.05,那么从统计学上讲,您几乎可以肯定会找到一个显着的结果。
我不同意这种说法,除非“偏见” Piantadosi 是指通常称为偏见的准确性的一部分。推理不会因为您选择停止本身而“有偏见”:它将是“有偏见的”,因为您的数据较少。所谓的“似然原则”指出,推理应该只依赖于观察到的数据,而不是可能已经观察到但没有观察到的数据。LP说
其中代表您正在测试的假设(以命题的形式,例如“治疗有效”),代表您实际观察到的数据,代表命题“实验提前停止”,代表先验信息(例如模型)。现在假设您的停止规则取决于数据和先验信息,因此您可以编写。现在一个基本的逻辑规则是 A——说 A 为真两次与说一次是一样的。这意味着因为只要和也是真的。所以在“布尔代数”中,我们有。这证明了似然原理的上述方程。只有当您的停止规则取决于数据或先验信息以外的其他内容时,它才重要。