我目前正在使用估算数据运行多元回归模型,并且有几个问题。
背景:
使用 SPSS 18。我的数据似乎是 MAR。案例列表删除只剩下 92 个案例,多重插补留下 153 个案例进行分析。满足所有假设 - 转换一个变量对数。9 IV 的 5 - 5 分类,3 等级,1 区间。DV 规模。使用标准多元回归的enter方法。
- 我的 DV 是前分数和后分数测量之间的分数差异,这两个变量都缺少一些案例 - 我应该为每个变量估算缺失值,然后计算它们之间的差异来计算我的 DV (我该怎么做),或者我可以为我的 DV 估算数据吗?哪种方法最合适?
- 我应该对转换后的数据还是倾斜的未转换数据进行插补?
- 我应该将所有变量都输入到插补过程中,即使它们没有丢失数据,还是应该只为丢失超过 10% 案例的变量插补数据?
我已经对列表删除的案例进行了回归,并且我的 IV 对我的 DV 中的方差几乎没有影响,随后我在多重插补后对完整文件运行了回归 - 结果非常相似,因为我的 9 IV 仍然仅预测我的 DV 中大约 12% 的方差,但是,现在我的一个 IV'S 表明它正在做出重大贡献(这恰好是一个对数转换变量)......
- 如果我的结论之间几乎没有差异,我应该报告原始数据 - 即我的 IV 对 dv 的预测不佳,还是报告完整的数据?