我有一个关于农业试验的数据集。我的响应变量是响应比:log(治疗/控制)。我对调节差异的因素感兴趣,所以我正在运行 RE 元回归(未加权,因为似乎很清楚,效应大小与估计的方差不相关)。
每项研究都报告谷物产量、生物量产量或两者兼而有之。我不能从仅报告生物量产量的研究中估算谷物产量,因为并非所有研究的植物都对谷物有用(例如甘蔗)。但是每一种生产谷物的植物也有生物量。
对于缺失的协变量,我一直在使用迭代回归插补(遵循 Andrew Gelman 的教科书章节)。似乎给出了合理的结果,整个过程总体上是直观的。基本上我预测缺失值,并使用这些预测值来预测缺失值,并遍历每个变量,直到每个变量近似收敛(分布)。
我有什么理由不能使用相同的过程来估算缺失的结果数据?考虑到谷物响应比、作物类型和我拥有的其他协变量,我可能可以为生物量响应比形成一个信息量相对丰富的插补模型。然后我会平均系数和 VCV,并按照标准做法添加 MI 校正。
但是,当结果本身被估算时,这些系数衡量的是什么?系数的解释与协变量的标准 MI 有什么不同吗?想一想,我无法说服自己这不起作用,但我不确定。欢迎对阅读材料提出想法和建议。