2
结果变量的多重插补
我有一个关于农业试验的数据集。我的反应变量是一个反应比率:log(治疗/对照)。我对调解差异的原因很感兴趣,因此我正在运行RE元回归(未加权,因为很明显效果大小与估计方差无关)。 每个研究报告谷物产量,生物量产量或两者。我无法从仅报告生物量产量的研究中得出谷物的产量,因为并非所有研究的植物都对谷物有用(例如,包括甘蔗)。但是每一种产生谷物的植物也都有生物量。 对于缺少的协变量,我一直在使用迭代回归插补(遵循安德鲁·盖尔曼的教科书章节)。它似乎给出了合理的结果,并且整个过程通常是直观的。基本上,我预测缺失值,并使用这些预测值预测缺失值,并遍历每个变量,直到每个变量近似收敛(分布)。 有什么原因使我无法使用相同的过程来估算缺失的结果数据?给定谷类响应比,作物类型和我拥有的其他协变量,我可能可以为生物量响应比形成一个相对有用的估算模型。然后,我将对系数和VCV求平均值,并按照标准做法添加MI校正。 但是,当推算结果本身时,这些系数将如何衡量?协变量的系数解释是否与标准MI有所不同?考虑一下,我无法说服自己这行不通,但我不确定。欢迎阅读材料的想法和建议。