我遇到了一项研究,其中所有 50 岁以上的患者按出生年份进行伪随机化。如果出生年份是偶数,则进行常规护理,如果是奇数,则进行干预。
它更容易实施,更难颠覆(很容易检查患者应该接受什么治疗),很容易记住(任务持续了几年)。但是,我仍然不喜欢它,我觉得适当的随机化会更好。但我无法解释为什么。
我的感觉是错的,还是有充分的理由更喜欢“真正的”随机化?
我遇到了一项研究,其中所有 50 岁以上的患者按出生年份进行伪随机化。如果出生年份是偶数,则进行常规护理,如果是奇数,则进行干预。
它更容易实施,更难颠覆(很容易检查患者应该接受什么治疗),很容易记住(任务持续了几年)。但是,我仍然不喜欢它,我觉得适当的随机化会更好。但我无法解释为什么。
我的感觉是错的,还是有充分的理由更喜欢“真正的”随机化?
你持怀疑态度是对的。一般来说,应该使用“真正的”随机化,因为通常人们并不了解相关因素(不可观察)。如果这些不可观察因素之一与奇数或偶数年龄相关,那么它也与他们是否接受治疗相关。如果是这种情况,我们无法确定治疗效果:我们观察到的效果可能是由于治疗,或由于未观察到的因素。
这不是真正随机化的问题,我们不期望治疗和不可观察之间有任何依赖性(当然,对于小样本,它可能存在)。
为了构建一个为什么这种随机化程序可能是一个问题的故事,假设该研究仅包括在越南战争开始时年龄为 17/18 岁的受试者。17 岁时没有机会被选中(如果我错了,请纠正我),而 18 岁时有机会。假设机会不可忽略,战争经历改变了人们,这意味着,几年后,这两个群体是不同的,即使他们相隔一年。所以也许治疗(药物)看起来不起作用,但因为只有越战退伍军人接受了它,这实际上可能是由于它对患有 PTSD 的人不起作用(或其他与作为老手)。换句话说,您需要两组(治疗组和对照组)相同,除了治疗,以确定治疗效果。
因此,除非您可以排除组之间没有未观察到的差异(但如果没有观察到,您将如何做到这一点?),真正的随机化是更可取的。
不时地维护逆向观点是一个很好的练习,所以让我首先提供一些支持这种伪随机化形式的理由。 它们主要是,它与任何其他形式的系统采样几乎没有什么不同,例如在田间网格点获取环境介质样本或对果园中的所有其他树进行采样,因此这种采样可能具有相当的优势.
这里的类比是完美的: 年龄从零开始按年份“网格化”,并沿着这个(一维)网格交替分配给组。这种方法的一些优点是保证样品在田间或果园(或年龄,在这种情况下)广泛、均匀地分散,这有助于消除与位置(或时间)相关的影响。当理论表明位置是响应变化的主要因素时,这可能特别有用。此外,除了非常小的样本,分析数据就像它们是一个简单的随机样本,引入的误差相对较小。此外,一些随机化是可能的:在现场我们可以随机选择网格的原点和方向。在目前的情况下,我们至少可以随机化偶数年是控制对象还是治疗对象。
网格采样的另一个优点是检测局部变化。 在现场,这将是异常反应的“口袋”。从统计学上讲,我们可以将它们视为空间相关性的表现。 在目前的情况下,如果相对狭窄的年龄范围有可能出现不寻常的反应,那么网格设计是一个很好的选择,因为纯随机设计可能会在其中一个组内偶然包含较大的年龄差距。(但更好的设计可能是分层:使用年龄相等来形成两个分析层,然后在每个层内独立地将患者随机分为对照组和治疗组。)
不幸的是,一旦我们了解实际报告年龄的方式,这种辩护就会崩溃。美国人口普查数据显示(1)自我报告的年龄往往四舍五入到五的倍数(我在农村街区组数据的分析中看到了这一点)和(2)这种趋势与较低的教育或社会经济地位的指标有关。(众所周知,虽然很难测试,但在许多自我报告的年龄中,最后一个数字是,某些工作领域的人,例如表演,倾向于减少他们报告的年龄,而其他人会出于各种目的夸大他们的年龄。)因此,至少在美国的某些地区(甚至是在世界其他地方更是如此),一个人报告的年龄的平等可能与对实验很重要的因素有关。这使得问题中的担忧不再是假设的:它是真实的。在这一点上,这个线程中以前的答案能够表达我想要做的额外想法,所以我会停下来邀请你重新阅读它们。
我同意你给出的例子是无害的,但是......
如果所涉及的代理人(执行干预的人或接受干预的人)意识到分配方案,他们可以利用它。这种自我选择应该是相当明显的,为什么它在大多数实验设计中都是有问题的。
我在犯罪学中知道的一个例子是这样的;该实验旨在测试家庭纠纷后入狱一晚的威慑效果与仅仅要求肇事者离开过夜的威慑效果。官员们得到了一本小册子,上面当前表格的颜色是为了确定罪犯的待遇。在特定事件中应该收到。
最终发生的事情是官员故意不遵守研究设计,并根据个人喜好选择了一张纸,以说明应该对罪犯做什么。在您的示例中,至少可以怀疑类似的多年捏造并不是极端的。
您提出的不是伪随机化。伪随机化使用种子根据计算机的内部时钟可再现地生成伪随机序列。随机分配不依赖于患者水平特征。
随机化的重点是平衡预测协变量的分布,而不仅仅是手段(而且不能保证你甚至会拥有它)。换句话说,对于任何给定的治疗患者,最接近的可用匹配对照总是会相差一岁。虽然很少有关于偶数年与奇数年出生的人的特征发表,但您引入了一种敏感性,否则在使用传统随机化时没有实际意义。
如果您使用确定性标准对患者进行随机分组,您将如何确保治疗与对照的大致 50:50(或其他)分配?如果您尝试按站点进行分层,情况会呈指数级恶化。
如果您需要随机选择三种不同的治疗方法之一怎么办?或者更糟糕的是,如果您开始随机分配到三个治疗组中的一个,然后根据安全性或有效性,您决定放弃一个治疗组并以 1:1 的比例随机化,那又如何呢?