在关于层次/多层次模型的文献中,我经常阅读“嵌套模型”和“非嵌套模型”,但这意味着什么?谁能给我一些例子或告诉我这个措辞的数学含义?
“嵌套”和“非嵌套”模型有什么区别?
嵌套与非嵌套可能意味着很多事情。您有嵌套设计与交叉设计(参见例如这个解释)。您在模型比较中有嵌套模型。嵌套在这里意味着较小模型的所有项都出现在较大模型中。这是使用大多数模型比较检验(如似然比检验)的必要条件。
在多级模型的背景下,我认为最好谈论嵌套和非嵌套因子。不同之处在于不同因素如何相互关联。在嵌套设计中,一个因素的水平仅在另一个因素的水平内才有意义。
假设您要测量叶子的氧气产量。您对许多树种进行采样,并在每棵树的底部、中间和顶部采样一些叶子。这是一个嵌套设计。不同位置的叶子的差异仅在一种树种中才有意义。因此,比较所有树木的底部叶子、中间叶子和顶部叶子是没有意义的。或者换一种说法:不应该将叶子位置建模为主要影响。
非嵌套因子是两个不相关的因子的组合。假设您研究患者,并且对年龄和性别的差异感兴趣。所以你有一个不相关的因素年龄等级和因素性别。您应该将年龄和性别作为主要影响进行建模,如有必要,您可以查看交互。
区别并不总是那么明显。如果在我的第一个示例中,树种在形式和生理学上密切相关,您可以将叶子位置也视为有效的主效应。在许多情况下,嵌套设计与非嵌套设计的选择更多是研究人员的决定,而不是真实的事实。
嵌套与非嵌套模型出现在联合分析和IIA中。考虑“红巴士蓝巴士问题”。你有一个人口,其中 50% 的人乘坐汽车上班,而另外 50% 的人乘坐红色巴士。如果在方程式中添加与红色总线具有相同规格的蓝色总线会发生什么?多项式 logit模型将预测所有三种模式的 33% 份额。 我们直观地知道这是不正确的,因为红色公共汽车和蓝色公共汽车彼此之间的相似性比汽车更相似,因此在从汽车中获取份额之前会从彼此那里获取更多份额。这就是嵌套结构的用武之地,它通常被指定为类似替代方案的 lambda 系数。
Ben Akiva 整理了一组很好的幻灯片,在这里概述了这方面的理论。他开始谈论关于幻灯片 23 的嵌套 logit。
如果您总是可以通过约束第二个模型的某些参数来获得第一个模型,则一个模型嵌套在另一个模型中。例如,线性模型嵌套在 2 度多项式中,因为通过设置 b = 0,2 度。多项式与线性形式相同。换句话说,一条线是多项式的特例,因此两者是嵌套的。
如果两个模型是嵌套的,主要的含义是在统计上比较它们相对容易。简而言之,使用嵌套模型,您可以将更复杂的模型视为通过向更简单的“空模型”添加一些内容来构建。因此,要从这两个模型中选择最佳模型,您只需确定添加的内容是否解释了数据中的大量额外差异。这种情况实际上相当于首先拟合简单模型并从数据中去除其预测方差,然后将更复杂模型的附加分量拟合到第一次拟合的残差(至少使用最小二乘估计)。
非嵌套模型可以解释数据中完全不同的方差部分。如果复杂模型不包含简单模型所拥有的“正确的东西”,那么复杂模型甚至可以解释比简单模型更少的方差。因此,在这种情况下,要预测在两个模型同样能很好地解释数据的零假设下会发生什么会有点困难。
更重要的是,在原假设下(并给出某些适度的假设),两个嵌套模型之间的拟合优度差异遵循已知分布,其形状仅取决于两者之间的自由度差异楷模。这不适用于非嵌套模型。
如果一个模型不能作为另一个模型的限制(或者一个模型不是另一个模型的特定情况),则两个模型是非嵌套的或分离的