我想根据研究问题对数据集进行统计分析,并通过 R 建立逻辑回归模型和多项线性模型。但我想知道我应该在哪一步使用缺失值插补来完成数据集。我已经完成了原始数据集中每个变量的单变量分析,我发现有三个连续变量和两个分类变量有很多缺失数据。在对每个变量进行双变量分析和图形探索处理后,我想使用缺失的数据插补来完成数据集。但我不确定这是否是正确的顺序?
我应该在双变量关联分析之前使用缺失值插补来完成数据集,还是应该在那之后进行?
此外,如果我想检查结果变量的分布以找到适当的转换,我是否应该在估算缺失数据后也这样做?
谢谢!