使用混合效应模型进行推理时,可以认为多少比例的缺失数据是可接受的

机器算法验证 混合模式 缺失数据 多重插补
2022-04-01 07:45:53

我想知道有多少比例的缺失数据可以被认为可以使用混合效应模型?

我正在分析一项临床试验,测试激动剂药物在减少非法药物使用天数方面的功效。试验开始时,安慰剂组有 67 名参与者,实验组有 61 名参与者。

到 12 周后的试验期结束时,每组有 30 人,占安慰剂组原始数量的 45%,安慰剂组剩余 49%。

到治疗后随访时,试验结束后 12 周(即试验开始后 24 周),安慰剂组剩下 29 人(原始数字的 43%),安慰剂组剩下 26 人组(也是原始的 43%)。在前瞻性临床酒精和药物研究中,这些损耗水平是相当正常的。

这种缺失程度是否会灾难性地降低您从纵向混合效应模型中做出的推论的价值?

如果这种缺失程度灾难性的,那么可以使用哪些其他方法

1个回答

这种缺失程度是否会灾难性地降低您从纵向混合效应模型中做出的推论的价值?

不必要。很大程度上取决于辍学的原因。如果数据随机缺失 (MAR),则合适的多重插补方法可以产生无偏或至少少得多的偏倚估计。在这里,我所说的“合适”是指处理个人内数据聚类的多重插补方案。

如果数据完全随机缺失 (MCAR),则可以使用完整案例分析从混合模型中获得无偏点估计,但标准误差将向上偏倚。同样,合适的多重插补方法将减少这种情况。

另一方面,如果数据不是随机丢失 (MNAR),那么您的未来可能会非常困难。

可以在此处找到对解决此问题的方法的一个很好的回顾:

Huque, MH, Carlin, JB, Simpson, JA 和 Lee, KJ, 2018。纵向研究中缺失数据的多重插补方法的比较。BMC 医学研究方法论,18(1),p.168。 https://www.ncbi.nlm.nih.gov/pubmed/30541455