我计划进行多组 SEM 分析。我收集了调查数据并计算了调查权重。我的一些变量有项目无响应(主要是 5% 左右的缺失)。
我决定使用多重插补来处理丢失的数据。首先,我使用LittleMCAR()测试来检查缺失机制。我也用过TestMCARNormality()Jamshidian 等人的。它对协方差的同质性进行了 MCAR 的非参数检验。后者没有拒绝 MCAR,但LittleMCAR测试拒绝了 (p=8.3%)。因为我假设我的数据是 MAR,所以我的数据分为男性/女性,我LittleMCAR()对每个子组应用了测试。这一次 MCAR 在两个亚组中都没有被拒绝。
我读过(参见:Enders, C., & Gottschall, A. (2011). Multiple Imputation Strategies for Multiple Group Structural Equation Models. Structural Equation Modeling: A Multisubject Journal, 35-54.)如果我打算这样做多组 SEM 分析,我应该对每个组进行单独的多重插补(在这种情况下:男性/女性)。R 包MICE将用于插补。
现在我的问题:
1.) 应该使用来自 MICE 的默认“大规模插补”预测矩阵
predictorMatrix = (1 - diag(1, ncol(data)),它使用数据集中的所有变量作为插补模型的预测变量,或者我应该使用quickpred()生成一个predictormatrix?quickpred使用一些标准(如预测变量和目标变量的相关性)为每个变量选择一组预测变量,这些变量将被估算。
quickpred(datensatz_gender_0, include=c("weight_trunc"),exclude=c("ID","X","gender"),mincor = 0.1)
2.) 我应该在预测矩阵中包含调查权重吗?
插补后,插补数据集列表将提供给survey()-包(用于加权目的),然后我将使用lavaan来指定我的模型,该模型将使用插补数据调查对象。然后将这个 lavaan 模型传递给lavaan.survey(),因此我可以将调查权重与估算数据一起使用。据我所知,lavaan.survey然后将汇总结果...
如果有人能给我这个问题的答案,那就太好了。谢谢!