基于完整模型的推理是否合适,如果合适,在什么情况下?
假设您对响应变量和几个候选预测变量之间的潜在关系感兴趣,并使用某种形式的回归(例如广义线性模型)来回答这个问题。推断哪些预测变量“重要”或与响应具有明显真实关系的一种方法是基于信息论标准(例如 AIC)的模型比较。即使最终模型中未保留的变量可能与响应有某种关系,但考虑到模型中保留的其他预测变量,它们基本上没有提供额外的实质性信息。
有没有一种情况更适合简单地拟合一个完整的(全局)模型(包含所有候选预测变量),停在那里,并仅根据 t 统计量(或其他统计量)和 p 值对单个预测变量进行推断在这个完整的模型中,没有进一步的模型选择?
我遇到了一些建议(例如 Whittingham 等人。“为什么我们仍然在生态和行为中使用逐步建模?”(2006 年)这可能是一件明智的事情,尽管有潜在的缺点。作者说估计的参数是无偏见,但其他消息来源称这些估计和 p 值不可信,因为模型中的其他(“非重要”)变量可能会影响它们。
如果目的是了解潜在的生物学关系,哪种方法更合适?