我想知道是否有人有使用小鼠功能的经验,如小鼠:R 中链式方程的多元插补(JSS 2011 45(3))中所述?我有一个包含许多变量的数据集,每个变量都有不同程度的缺失数据。
我的主要问题是:假设我使用贝叶斯线性回归来估算缺失数据,是否会mice
自动使用从最重要到最不重要的预测变量进行估算?此外,对所有估算数据集进行平均是否很常见?
我想知道是否有人有使用小鼠功能的经验,如小鼠:R 中链式方程的多元插补(JSS 2011 45(3))中所述?我有一个包含许多变量的数据集,每个变量都有不同程度的缺失数据。
我的主要问题是:假设我使用贝叶斯线性回归来估算缺失数据,是否会mice
自动使用从最重要到最不重要的预测变量进行估算?此外,对所有估算数据集进行平均是否很常见?
默认情况下,老鼠将使用数据集中的所有变量来预测任何其他变量。
至于平均,您需要在计算统计数据之后执行此操作,而不是之前。例如,如果你想做一个线性回归,你会做这样的事情:
library(mice)
mi <- mice(dataset)
mi.reg <- with(data=mi,exp=glm(y~x+z))
mi.reg.pool <- pool(mi.reg)
summary(mi.reg.pool)
汇总功能将向您显示平均系数。