单向和双向固定效应的区别及其估计

机器算法验证 面板数据 固定效应模型 异质性
2022-03-22 05:27:27

考虑一个基本的线性未观察效应面板数据模型,例如:

Yit=βxit+ci+λt+uit,t=1,,T
向量在哪里xit包含自变量和uit是一个错误术语。个人数量是N. 假设未观察到的个体效应ci可能与xit(固定效应假设)。

第一个问题:“单向”和“双向”模型有什么区别?Wooldridge (2006 & 2010) 从不使用这个术语。我假设单向模型不包括时间效应,例如:

Yit=βxit+ci+uit,t=1,,T(1)
但双向模型还包括时间效应:
Yit=βxit+ci+λt+uit,t=1,,T(2)

根据 Frisch-Waugh-Lovell 定理,组内估计器和最小二乘虚拟变量 (LSDV) 估计器都为等式 (1) 产生相同的系数。
这引出了我的第二个问题:你将如何估计方程(2)?你能先包括T时间假人(应该是T1?) 然后在内部估计器或 LSDV 估计器之间进行选择? 这个答案建议首先使用内部转换,然后估计模型,包括虚拟变量,我觉得很困惑。

参考文献:
Woodridge, JM (2006)。计量经济学导论(第 3 版)。汤姆森/西南。
伍德里奇,JM(2010)。横截面和面板数据的计量经济学分析(第 2 版)。麻省理工学院出版社。

编辑:我看了一些讲义(这里这里这里),似乎双向模型包括有时称为“时间(固定)效应”的东西(见λt在等式(2)中),正如我所假设的。
我的理解是,a)可以将某种不同的内部转换应用于双向模型,或者 b)一维(时间或个人)包含假人,然后转换中的“正常”(减去手段)用于应用另一个维度。
根据估计程序,由于自由度不同,必须校正标准误差。此外,程序 a) 似乎只对平衡面板有效。我还没有找到教科书参考。

2个回答

未观察到的效应模型建模为:

y=Xβ+u
在哪里
u=ci+λt+vit

单向误差模型假设λt=0而双向误差允许λR这就是第一个问题的答案。

如果不对研究的错误结构或目的进行更多假设,就无法回答第二个问题。使用 Wooldridge (2010) 第 10 章和第 11 章,概括每个假设以涵盖时间误差结构。例如,在考虑 POLS 时,关键假设是E(xitu)=0. 本章总结为满足以下条件:

  1. E(xitc)=0
  2. E(xitv)=0

但是,如果不假设λt=0,即双向误差模型,必须满足第三个条件才能使 POLS 估计量保持一致:

E(xitλ)=0
等等。

在估计固定效应的情况下,可以使用 LSDV(包括面板 ID 和时间 ID 的指标),但维度可能很快变得不可行。一种替代方法是在估计器中使用单向误差并包括时间虚拟变量,例如通常使用不允许双向误差模型(如 Stata)的软件使用的时间虚拟变量。第三种也是最有效的方法是使用估计器内的双向误差来估计它。

yity¯i.y¯.t+y¯..=(xitx¯i.x¯.t+x¯..)β
这种方法被编码在几个统计包中,例如 R 包plm并正确调整自由度以包含 T - 1 个附加参数,与估计器中的单向误差相比。大多数二错误方式模型估计器不限于平衡面板(只有少数)。对于短面板,在具有时间虚拟变量的估计器内运行单向误差是可行的。作为旁注,即使人们获得了时间效应的估计值,重要的是要注意,与单向误差模型的 LSDV 固定效应一样,随着面板数量和长度的估计值的增加,这些并不一致。

我推荐 Baltagi (2013) 教科书,对单向和双向误差模型的估计量进行了相当全面的解释。

参考:

Baltagi, Badi H. 2013。面板数据的计量经济学分析。第五版。西萨塞克斯郡奇切斯特:John Wiley & Sons, Inc. isbn:978-1-118-67232-7。

羊角面包、伊夫和乔瓦尼·米洛。2008.“R 中的面板数据计量经济学:plm 包”。统计软件杂志 27 (2)。doi:10.18637/jss.v027.i02。

斯塔塔公司 2017. Stata 15 基础参考手册。德克萨斯州大学城:Stata Press。

Wooldridge, Jeffrey M. 2010。横截面和面板数据的计量经济学分析。Kindle版。麻省理工学院出版社。国际标准书号:978-0-262-23258-8。

来自这篇关于可靠性和类内相关系数的论文:https ://www.sciencedirect.com/science/article/pii/S1556370716000158

单向随机效应模型 在该模型中,每个受试者由一组不同的评分者进行评分,这些评分者是从大量可能的评分者中随机选择的。实际上,该模型很少用于临床可靠性分析,因为大多数可靠性研究通常涉及同一组评估者来衡量所有受试者。一个例外是多中心研究,其中中心之间的物理距离禁止同一组评估者对所有受试者进行评估。在这种情况下,一组评估者可以评估一个中心的一个子组,另一组评估者可以评估另一个中心的一个子组,因此,在这种情况下应该使用单向随机效应模型。

双向随机效应模型 如果我们从具有相似特征的大量评估者中随机选择评估者,则选择双向随机效应模型。换句话说,如果我们计划将我们的可靠性结果推广到与可靠性研究中选定的评估者具有相同特征的任何评估者,我们将选择 2-way 随机效应模型。该模型适用于评估基于评估者的临床评估方法(例如,被动活动范围),这些方法旨在供具有可靠性研究中所述的特定特征(例如,多年经验)的任何临床医生常规临床使用。

双向混合效应模型 如果选定的评估者是唯一感兴趣的评估者,我们应该使用 2 向混合效应模型。使用此模型,结果仅代表参与可靠性实验的特定评估者的可靠性。即使这些评估者与可靠性实验中选定的评估者具有相似的特征,它们也不能推广到其他评估者。因此,2 因素混合效应模型在评估者间可靠性分析中不太常用。