在哪些情况下应该考虑使用多级/分层分析而不是更基本/传统的分析(例如,ANOVA、OLS 回归等)?是否有任何情况可以认为这是强制性的?是否存在不适合使用多级/分层分析的情况?最后,对于初学者学习多层次/层次分析有哪些好的资源?
在什么情况下应该使用多级/分层分析?
当您的数据结构自然是分层或嵌套时,多级建模是一个不错的选择。更一般地说,它是一种建模交互的方法。
一个自然的例子是,当您的数据来自国家、州、地区等有组织的结构时,您希望在这些结构中检查这些级别的影响。可以拟合这种结构的另一个示例是纵向分析,其中随着时间的推移您对许多受试者进行重复测量(例如对药物剂量的一些生物反应)。您的模型的一个级别假定所有受试者随时间推移的组平均响应。然后,您的模型的另一个级别允许来自组平均值的扰动(随机效应),以模拟个体差异。
Gelman 的《使用回归和多级/分层模型的数据分析》是一本受欢迎且不错的入门书籍。
多级建模中心有一些很好的多级建模免费在线教程,他们有在他们的 MLwiN 软件和 STATA 中拟合模型的软件教程。
将此视为异端,因为我在书中只读过一章,但强烈推荐由 Stephen W. Raudenbush 和 Anthony S. Bryk 撰写的 Hierarchical linear models: applications and data analysis methods。我还发誓在 Springer Use R 中有一本关于使用 R 软件进行多层次建模的书!系列,但我现在似乎找不到它(我认为它是由编写 R 初学者指南的同一个人编写的)。
编辑:关于将 R 用于多级模型的书是Mixed Effects Models and Extensions in Ecology with R by Zuur, AF, Ieno, EN, Walker, N., Saveliev, AA, Smith, GM
祝你好运
这是使用多级与回归模型的另一个观点:在 Afshartous 和 de Leeuw 的一篇有趣的论文中,他们表明,如果建模的目的是预测性的(即预测新的观察结果),则模型的选择不同于何时目标是推理(您尝试将模型与数据结构匹配)。我指的论文是
Afshartous, D., de Leeuw, J. (2005)。多级模型中的预测。J.教育。行为。统计学家。30(2):109-139。
我刚刚在这里找到了这些作者的另一篇相关论文:http: //moya.bus.miami.edu/~dafshartous/Afshartous_CIS.pdf
这是一个多级模型可能是“必不可少的”的示例。假设您想使用学生的考试成绩对一组学校提供的教育的“质量”进行评分。定义学校质量的一种方法是在考虑学生特征后的平均考试成绩。您可以将其概念化为,
有了模型,问题就变成了估计问题。如果您有很多学校和每所学校的大量数据,那么 OLS 的优点(参见 Angrist 和 Pischke,Mostly Harmless...,对于当前的审查)建议您使用它,对标准误差进行适当的调整以解释依赖关系,并使用虚拟变量和交互来获得学校水平的影响和学校特定的截距。OLS 可能效率低下,但它非常透明,如果您使用它可能更容易说服持怀疑态度的观众。但是如果你的数据在某些方面是稀疏的——特别是如果你对某些学校的观察很少——你可能想要对这个问题施加更多的“结构”。如果在没有结构的情况下进行估计,您可能希望从大样本学校“借力”来改善在小样本学校中得到的嘈杂估计。然后,您可能会转向通过 FGLS 估计的随机效应模型,
在此示例中,使用多级模型(但我们最终决定对其进行拟合)是出于对学校级截距的直接兴趣。当然,在其他情况下,这些组级参数可能只是令人讨厌。您是否需要针对它们进行调整(因此,仍然使用某种多级模型)取决于某些条件外生性假设是否成立。对此,我建议查阅有关面板数据方法的计量经济学文献;从那里得到的大多数见解都会延续到一般的分组数据上下文中。