组序列设计中的停止规则

机器算法验证 临床试验 顺序分析
2022-04-17 04:54:16

我在组顺序设计中读过,最多有k停止,对于j-第站j<k选择了 4 个边界aj,bj,cj,dj以便考虑这三个决定。可以在此处找到支持这一概念的一组讲义

  1. 拒绝H=,H+有利于H如果T<aj(拒绝无用,有利于伤害)。
  2. 拒绝H,H+有利于H=如果bj<T<cj(拒绝伤害,受益于徒劳)。
  3. 拒绝H,H=有利于H+如果T>dj(拒绝伤害,有利于利益的徒劳)。

否则继续直到下一站。

有一个徒劳的假设有什么意义在我看来,它要么是负面的研究结果,要么是正面的研究结果:因此,它应该被指定为先验如果无效是“负面的”,则意味着赞助商没有兴趣继续销售他们的药物,因为它并不比现有疗法好。如果是这样的话,那么T>ajT<bj似乎是停止这项研究的理由,因为我不太在乎是否有害或无用:我不会出售这种药物。

如果无效是“积极的”,则意味着申办者有兴趣将他们的设计策略转向证明非劣效性,因为他们的新药可能更便宜或耐受性更好或相互作用更少。在那种情况下,在我看来,他们做了错误的研究。他们应该从一开始就进行非劣效性设计。

1个回答

有一个徒劳的假设有什么意义?

政府法规医学伦理通过描述人类和非人类动物受试者研究的良好临床实践 (GCP) 来影响医学研究的设计和管理临床试验的进行。

文章中的示例和支持引用:

"方法

条件能力用于评估试验在最终分析中的无效性或无法显示非劣效性,方法是根据观察到的结果和对试验未来结果的假设,计算在最终分析中证明非劣效性的概率。审判。大疱类天疱疮类固醇和四环素研究 (BLISTER) 试验是可能同时出现劣效和非劣效结果的试验示例。描述了一种使用模拟计算非劣效性条件功效的方法,并将其应用于该试验的假设中期分析。

结果

与优势试验中使用的典型方法相比,基于条件能力的无效停止指南被证明更适合非劣效性试验。模拟是一种直接且灵活的计算条件功率的方法。

结论

有条件的权力是一个合适的工具,用于定义非劣效性试验中无效的停止指南,特别是那些具有大的非劣效性边缘的试验。”。

"摘要

非劣效性试验旨在表明新疗法的效果不比主动对照的效果差超过规定的幅度。这些试验有许多优效性试验没有的固有弱点:没有对检测敏感性的内部证明,没有单一的保守分析方法,缺乏对盲法偏倚的保护,以及难以确定非劣效性界限。当安慰剂组不能从伦理上纳入时,有时可能需要进行非劣效性试验,但应该认识到,此类试验的结果不如优效性试验的结果可信。

术语

“非劣效性”是一个相对较新的术语,尚未被普遍采用,过去有重要区别的非劣效性和等效性试验都被称为“等效性试验”。更糟糕的是,这两个术语都有一定的误导性。

根本不可能证明两种治疗具有完全相同的效果。因此,等效试验旨在表明效果的差异不超过特定量。这种公差称为等价余量,通常用符号 δ 表示。在等效试验中,如果两种处理的效果在任一方向上的差异超过等效边界,则等效不成立。另一方面,非劣效性试验旨在表明实验性治疗不比主动控制差超过等效界限。任何规模的改进都符合非劣效性的定义。生物等效性试验是真正的等效性试验,

"背景

许多临床试验显示没有总体益处。我们检查了应用于具有不同效应大小的试验的无效分析。

方法

回顾性分析了十项随机癌症试验;全部达到目标样本量。风险比表明没有总体益处(n=5)、中等(n=4)或大(n=1)治疗效果。在观察到 25%、50% 和 75% 的事件或招募患者后应用无效分析。结果是条件功率 (CP) 以及时间和成本节省。

结果

无效性分析可以阻止一些没有好处的试验,但不是全部。在观察到 50% 的目标事件数后,可以提前停止 5 个试验中的 3 个无益处(低 CP ≤ 15%)。两项研究的试验时间可以减少 4-24 个月,节省 44 000-231 000 英镑,但第三项研究已经停止招募,因此没有节省。然而,令人担忧的是,4 项治疗效果中等的试验中有 2 项可能会在某个时候提前停止,尽管它们最终显示出有价值的益处。

结论

谨慎使用无效可能会导致试验中的未来患者不会得到无效的治疗,因此应该更频繁地使用。第二个考虑是它可以缩短试验时间并降低成本。然而,具有适度治疗效果的研究可能不恰当地过早停止。除非有非常好的证据证明无效,否则通常最好继续到计划的终点。”。

"摘要

非劣效性试验测试新的实验性治疗是否比已经在使用的主动控制治疗的疗效低得令人无法接受。随着卫生技术、标准护理和临床结果的不断改进,新开发的治疗方法的增量收益可能仅比现有治疗方法微不足道。有时将患者分配给安慰剂是不道德的。在这种情况下,越来越强调使用非劣效性试验设计。与典型的优效性试验相比,非劣效性试验的设计、实施和解释更加复杂。本文回顾了非劣效性试验的概念,并讨论了与它们相关的一些重要问题。”。

请继续阅读提供的链接。

“……我不在乎有没有害处或无用处:我不会卖这种药的。”

伤害和徒劳之间有很大的区别,安慰剂效应是某些类型试验的必要考虑因素。这些测试在批准销售之前很久就完成了,在某些情况下,在某些情况下有害的药物在其他情况下可以挽救生命。这就是为什么一些设计要求三个类别,后来在试验中只使用有效药物,因为有害或安慰剂产品已经从试验中删除。


单独使用条件权力来指导停止可能是不正确的。多年的试验方法教育和研究对于设计合格的临床试验是必要的。需要考虑的事情太多,需要专家团队的指导,不建议依赖 Stack Exchange 的答案。事实上,本网站和本作者均未提供医疗建议,这只是试图向对这个问题有共同兴趣的外行提供一个简短的答案,并在几个月的进一步阅读中寻求指导。

有关其他统计方法的讨论,请参见以下论文,其中作者探讨了与贝叶斯后验概率、p 值、条件功率或组序列方法相比,贝叶斯预测概率有利于临时监测的设置。

Benjamin R. Saville、Jason T. Connor、Gregory D Ayers 和 JoAnn Alvarez 撰写的“贝叶斯预测概率在临床试验中期监测中的效用”(2014 年 5 月 28 日)。DOI:10.1177/1740774514531352

背景

贝叶斯预测概率可用于临床试验的中期监测,以估计如果试验继续达到其预定义的最大样本量,观察到具有统计学意义的治疗效果的概率。

...

结论

使用贝叶斯预测概率可以选择与临床决策过程密切一致的逻辑临时停止规则。

...

中期分析解决的两种常见问题类型包括 1) 是否有令人信服的证据支持无效假设或替代假设?2) 如果收集到更多数据,试验是否可能显示有利于替代假设的令人信服的证据?第一个问题与数据目前显示的证据有关,最好使用估计、p 值或贝叶斯后验概率来解决。第二个处理预测在研究的后期阶段将提供哪些证据,最好使用随机缩减方法(例如条件功率或预测概率)来解决。

条件功率经常因假设未知参数固定在特定值而受到批评。相比之下,贝叶斯预测概率将试验成功的概率平均在参数估计的可变性上,并且无论试验的主要分析是频率分析还是贝叶斯分析,都可以使用. 它们最常用于在最终预先确定的样本量下预测试验成功,但也可用于根据临时样本量预测试验成功并延长随访时间。预测概率已在文献中广泛讨论。然而,文献缺乏对中期监测预测概率优势的一般性讨论。本文将预测概率与临床试验中期监测的传统方法进行了对比。我们说明了预测概率比更传统的中期监测方法具有优势的环境,特别是在无效监测和具有滞后结果的疗效监测的背景下(第 2-4 节)。