如何在 R 小鼠插补包中使用受限三次样条

机器算法验证 数据插补 多重插补 样条
2022-03-30 03:38:02

我想知道如何将受限三次样条(例如在 rms 包中)集成到 R 小鼠插补包中的插补模型中。

背景:我正在进行生物医学研究,并且可以访问一个数据集,该数据集包含患者特征和有关患者疾病进展的数据,以及医疗后的结果(例如一年生存期)。目标是建立一个基于患者特征和疾病进展的预测模型,以预测某些结果的发生。唉,有些患者没有关于所有变量的完整信息。因此,我决定使用多种插补技术来估计(多次)这些缺失值是什么。

问题:当使用多重插补时,有一个称为投机性的“规则”。这意味着插补要求用于最终分析的统计模型(即我要研究的预测模型)也应包含在插补模型中(最好添加额外的信息)。这也意味着要考虑可能的非线性关联。由于我不知道某些预测变量是否与其他预测变量具有非线性关联,因此我希望插补模型能够拟合受限三次样条曲线。但是,我并不真正掌握如何在老鼠身上做到这一点。因此,我希望帮助创建适用于小鼠的 rcs 插补模型。


在任何主持人的旁注中:我认为这个问题适合交叉验证,因为插补和样条是特定的“统计”主题。但是,由于对这个“如何”问题的编程性质的关注,如果您认为它更适合其他地方,我不介意迁移该问题。根据这个疑问,我还在 StackOverflow 上发布了这个问题(https://stackoverflow.com/questions/45674088/how-to-use-restricted-cubic-splines-with-the-r-mice-imputation-package

1个回答

你是对的,插补模型需要与结果模型一样丰富或更丰富。事实上,基于完全最大似然估计的插补和通过假设线性进行的插补是我编写 R包函数mice的主要原因,该函数使用丰富的加性受限三次样条模型自动创建插补模型。因此,多重插补不假定线性。中的默认方法是预测均值匹配,我通常更喜欢更多参数方法(仍然使用样条;PMM 在模型左侧的参数较少)。HmiscaregImputearegImpute

micearegImpute使用链式方程。与 不同mice的是,它使用引导绘制而不是近似(假设多元正态性)贝叶斯后验绘制。