数据挖掘 - 何时在数据分析问题中使用缺失数据插补？ - 吾爱随笔录

我想根据研究问题对数据集进行统计分析，并通过 R 建立逻辑回归模型和多项线性模型。但我想知道我应该在哪一步使用缺失值插补来完成数据集。我已经完成了原始数据集中每个变量的单变量分析，我发现有三个连续变量和两个分类变量有很多缺失数据。在对每个变量进行双变量分析和图形探索处理后，我想使用缺失的数据插补来完成数据集。但我不确定这是否是正确的顺序？

我应该在双变量关联分析之前使用缺失值插补来完成数据集，还是应该在那之后进行？

此外，如果我想检查结果变量的分布以找到适当的转换，我是否应该在估算缺失数据后也这样做？

谢谢！