我想知道如何将受限三次样条(例如在 rms 包中)集成到 R 小鼠插补包中的插补模型中。
背景:我正在进行生物医学研究,并且可以访问一个数据集,该数据集包含患者特征和有关患者疾病进展的数据,以及医疗后的结果(例如一年生存期)。目标是建立一个基于患者特征和疾病进展的预测模型,以预测某些结果的发生。唉,有些患者没有关于所有变量的完整信息。因此,我决定使用多种插补技术来估计(多次)这些缺失值是什么。
问题:当使用多重插补时,有一个称为投机性的“规则”。这意味着插补要求用于最终分析的统计模型(即我要研究的预测模型)也应包含在插补模型中(最好添加额外的信息)。这也意味着要考虑可能的非线性关联。由于我不知道某些预测变量是否与其他预测变量具有非线性关联,因此我希望插补模型能够拟合受限三次样条曲线。但是,我并不真正掌握如何在老鼠身上做到这一点。因此,我希望帮助创建适用于小鼠的 rcs 插补模型。
在任何主持人的旁注中:我认为这个问题适合交叉验证,因为插补和样条是特定的“统计”主题。但是,由于对这个“如何”问题的编程性质的关注,如果您认为它更适合其他地方,我不介意迁移该问题。根据这个疑问,我还在 StackOverflow 上发布了这个问题(https://stackoverflow.com/questions/45674088/how-to-use-restricted-cubic-splines-with-the-r-mice-imputation-package)