简单英语混合模型

机器算法验证 混合模式
2022-04-04 06:32:07

有人可以简单地解释一下混合模型背后的直觉吗?每当我阅读解释时,我都会被符号和数学术语所淹没。有人可以给我一个简单的例子或动机来帮助我更深入地理解这个概念吗?

2个回答

这是我在这方面的努力 - 不完美,但可能会有所帮助。

当响应变量的变化不能简单地分配在结构部分和残余个体随机性之间时,需要混合效应模型。混合效应模型兼具这两点,但也存在随机性,不仅与个人相关,还与群体相关。

典型的例子是学生的表现。在个体层面存在(大)随机变化因素。但是每所学校也可以被视为对该学校每个人的表现贡献了一个共同的随机因素。一所特定的学校可能出于随机原因(很幸运有好老师等)获得高分。因此,这些学生的随机性不能被视为彼此独立——打破了更传统模型的许多假设。

这个概念可以扩展到简单的剩余随机性之外,也可以应用于模型中各种参数(斜率等)中组级别的随机变化。

总而言之,混合效应模型不仅可以避免传统模型在违反其独立同分布假设时的陷阱;它们可以提供强大的技术来确定不同级别的随机性有多少。

最容易理解的混合效应模型是那些随机性的不同来源处于层次结构中的模型(例如个人-班级-学校)。但是,它们可以扩展到非分层分组。例如,个别学生可以按他们的数学老师和物理老师分组,这可能不是简单的关系。但是仍然可以估计每个学生的个体随机性(即个体残差)以及对 A 先生的数学学生的所有学生和 B 女士的所有物理学生的另一个共同影响。(我假设响应变量是对所有这些学生共享的整体学业成绩的某种测试,当然)。

那么是什么让它“混合”呢?混合意味着模型混合了结构和随机组件。在某种程度上,传统模型已经混合在一起——它们具有结构成分和个体随机性。只是由于命名法的历史偶然性,模型只有在除了个体级别之外还具有至少一个随机分量时才被称为混合模型。

我将提供一个我认为会有所帮助的简短回复,但不会详细说明。

当我相信我的数据中的错误不是来自单一来源,并且当我有可以识别替代来源的信息时,我会使用混合效应模型(即具有固定效应和随机效应的模型)。当数据分层时,通常使用混合模型结构化的。例如,教室里的学生。毫无疑问,每个学生的测量都会有误差,并且可以很好地建模为正态分布。但是,学生学习的课堂可能会解释其他错误(可能是由于教师/主题/教科书)。因此,有一个额外的错误术语来捕获由于课堂引起的错误可能很重要。也就是说,对单个测量误差的单个源建模的单个误差项可能无法适当地捕获来自更高级别源的误差。因此,为了正确地对数据进行建模,可能需要将学生错误和课堂错误分开划分。由此产生的拟合模型将更好地拟合数据,并且应该减少其他模型参数的偏差。

不过,混合模型可以做得更多。我不会详细介绍这些细节,因为我认为以上是您目前正在寻找的内容。