非随机缺失 (MNAR) 数据的敏感性分析

机器算法验证 r 缺失数据 多重插补 老鼠 敏感性分析
2022-03-29 06:07:44

我目前有一个数据集,其中包含具有不同缺失程度的变量。我分析的关键变量之一有大约 12% 的值未随机缺失 (MNAR)。

从我之前所做的研究中,我收集到大多数当前的 MI 方法都假设 MAR 机制,但在 MNAR 场景中仍然有用。处理 MNAR 数据的最糟糕的解决方案仍然是完整的案例分析。

我听说您可以通过使用模式混合模型和选择模型来处理 MNAR,但我没有在 R(这是我通常用于分析的软件)中使用这些的经验。或者,我已经看到该mice包有一个称为mice.impute.ri“不可忽略数据”的方法。我还看到有一个较旧的软件包(从 2011 年开始),它在插补完成SensMice后执行敏感性分析。mice但是,它似乎不再与我的 Rstudio 版本兼容,而且这个包似乎没有太多最新消息。

有人对我如何对这个变量进行插补有实用的建议吗?最好提供与可能有用的特定 R 包相关的建议。否则,在估算过程中采取的理论建议或步骤也值得赞赏。

1个回答

我目前也在处理同样的问题。我有一个包含 70 个可变量的数据集,其中很多都有缺失值。他们中的大多数肯定是MNAR。

我发现的一篇很棒的论文就是这篇。 http://journals.lww.com/epidem/Fulltext/2011/03000/Sensitivity_Analysis_When_Data_Are_Missing.25.aspx

他们还使用 SensMice 进行了敏感分析,并提供了很好的示例。

你的分析有进展吗?我仍在努力解释用老鼠进行的敏感性分析。

我的意思是对一个变量进行敏感性分析需要做很多工作,而我有 70 个变量....

我可以问一件事来澄清一下吗?您进行敏感性分析是因为您想看看如果您从 MAR 假设慢慢漂移到 MNAR 会发生什么,对吗?因此,您逐步更改假设分布中的参数...但是最终您将无法找到“最佳”参数,您只知道在解释参数时必须小心的值是什么预测模型(因为您使用了 MAR 假设)。最后,您仍然在 MAR 假设下使用 MICE....

我在这个话题上挣扎了一段时间,我真的不确定我是否理解正确....也许你可以帮助我?