混合模型固定效应

机器算法验证 聚类 混合模式 面板数据 固定效应模型
2022-04-17 08:20:59

与面板数据一起使用的一种标准模型是固定效应:yit=μi+θt+ϵit, 在哪里i是个人和t是时间下标。这可以使用 OLS 和虚拟变量轻松估计。

该模型假设有一个单一的基础时间序列,θt为了t=1,2,...,T. 假设数据中的所有个体都遵循这个时间序列加上一些个体效应,该效应相对于时间是恒定的。

然而,假设有两组或更多组个体,每个组都有自己的时间序列,并且在查看数据之前,我们不知道谁在哪个组中。我想估计这种情况下的固定效应模型,并找出哪个人在哪个组/集群中。

我想到的方法是模型应该变成:yit=μi+jπijθjt+ϵit.j表示组1,2,...,J.πij是个体的概率i在群里j.θjt是组的时间效应j有时t.

在我的特定应用程序中,{πij}需要一组附加参数。但是,我可以看到在其他应用程序中,它可以建模为一些协变量的函数。

这个模型是一个好方法吗?以前有人试过吗?我如何估计这个模型?该模型有很多参数。我已经尝试了基本的优化,但它没有奏效。理想情况下,我正在寻找进行估计的软件,例如 R 中的包;或者,我可以用来编程的可靠参考。

如果我提出的模型不是一个好方法,我还能如何解决这个问题?我可以看到的一种可能性是首先确定哪个个体属于哪个集群,然后在每个集群上估计一个常规的固定效应模型。那么问题是如何执行数据分类。无论采用哪种方法,我仍在寻找软件或好的参考。

3个回答

这种类型的模型多年来一直被教育研究人员以混合增长模型的名义(不同的学生表现出不同的学习率吗?),尽管他们将其作为随机效应模型使用。我认为您无法为此模型提出适当的固定效应估计,因为它可能缺乏您可以根据的足够统计数据。但是一个成熟的 ML 模型不应该非常难以拟合。

在 Stata 中,您可以尝试fmm使用一整套面板 id 假人和/或与时间的交互,尽管这在自由度方面是一种非常浪费的方法。

您正在尝试拟合“混合模型”,但我建议不要单独设置πij每个人的参数,而是将这些概率建模为一些协变量的函数(即逻辑)。你甚至可以从一个常数开始πj. 拟合混合模型的典型方法是 EM(期望最大化)算法,尽管对于更简单的版本,甚至直接最大化也可以工作。

也许搜索这些术语将帮助您找到已经存在的解决方案。

我怀疑你的意思是yit=μi+jIijθjt+ϵit在哪里Iij是个人的指标i属于组j(有概率πij. 我还想知道您是否真的要允许不同的个人有不同的组分配概率?我猜测πj就足够了?

我想它可以被视为具有多项效应的随机/混合效应(不是混合)。这可能是一个不恰当的术语,因为“随机效应”通常适用于高斯随机效应。

另请注意,您不是在处理高斯混合,因为您允许高斯的个体移位(μi)。

无论如何,我可以想到两种方法:

  1. 使用您可以自己编写的 en EM 算法编写可能性并使其最大化。
  2. 计算μi通过在个人内部进行平均(假设您有足够的观察结果)。残差将像高斯位置混合一样分布在每个t. 您可以使用标准的 EM 实现,例如mixtools R 包来估计{θjt}{πj}.