小鼠插补函数是如何工作的?

机器算法验证 r 回归 贝叶斯 数据插补 老鼠
2022-03-17 18:11:56

我想知道是否有人有使用小鼠功能的经验,如小鼠:R 中链式方程的多元插补(JSS 2011 45(3))中所述?我有一个包含许多变量的数据集,每个变量都有不同程度的缺失数据。

我的主要问题是:假设我使用贝叶斯线性回归来估算缺失数据,是否会mice自动使用从最重要到最不重要的预测变量进行估算?此外,对所有估算数据集进行平均是否很常见?

1个回答

默认情况下,老鼠将使用数据集中的所有变量来预测任何其他变量。

至于平均,您需要在计算统计数据之后执行此操作,而不是之前。例如,如果你想做一个线性回归,你会做这样的事情:

library(mice)
mi <- mice(dataset)
mi.reg <- with(data=mi,exp=glm(y~x+z))
mi.reg.pool <- pool(mi.reg)
summary(mi.reg.pool)

汇总功能将向您显示平均系数。