多重插补后合并校准图

机器算法验证 数据可视化 数据插补 多重插补 汇集 校准
2022-01-24 15:14:20

我想在多重插补后汇集校准图/统计数据的建议。在开发统计模型以预测未来事件(例如,使用来自医院记录的数据来预测出院后生存或事件)的设置中,可以想象有一些或很多缺失的信息。多重插补是处理这种情况的一种方法,但需要考虑到由于插补的固有不确定性导致的额外可变性,需要从每个插补数据集中汇集测试统计数据。

我知道有多个校准统计数据(hosmer-lemeshow、Harrell 的 Emax、估计的校准指数等),“常规”鲁宾的合并规则可能适用。

然而,这些统计数据通常是校准的整体测量,不显示模型的特定未校准区域。出于这个原因,我宁愿看一个校准图。遗憾的是,我对如何“汇集”图表或它们背后的数据(每个人的预测概率和每个人观察到的结果)一无所知,并且在生物医学文献(我熟悉的领域)中找不到太多,或者在这里,在 CrossValidated 上。当然,查看每个插补数据集的校准图可能是一个答案,但是当创建大量插补集时可能会变得非常麻烦(呈现)。

因此,我想问一下是否有技术会导致校准图,在多重插补后汇集(?)

1个回答

[...] 如果您的 n 为 1,000 并且您有 5 个 MI 数据集,为什么不从 5,000 创建一个校准图,并在这 5,000 中以任何所需的方式比较观察/预期?

关于参考:

没有参考文献,我们最近发表了一篇论文,我们在没有证据的情况下声明,我们通过以这种方式将它们汇集在一起​​,获得了引导标准错误和多重插补的推论。我认为您可以说分析的目的是在 0.05 水平上测试期望/观察比或差异在正态分布范围内,并且分位数估计与样本量无关,因此基于 95% CI 进行测试不受池化的影响。