汇总横截面数据和面板数据有什么区别?

机器算法验证 回归 计量经济学 面板数据 数据集 横截面
2022-01-23 19:06:05

他们看起来如此相似。它们是同一个东西,只是被称为不同的名字吗?

4个回答

当我看到面板数据时,我会想到纵向数据,即在同一主题上多次对同一个人收集的观察结果。重复的横截面应该是相同的主题,但是每次观察都会得到不同的个体样本。我欢迎其他描述。

这里的答案非常简单:汇总的横截面数据和纯面板数据都会随着时间的推移收集数据(范围可以从 2 个时间段到任何较大的数字)。两者之间的主要区别在于我们遵循的“单位”。我将单位定义为家庭、国家或任何我们收集数据的对象。

合并横截面中,我们将在不同的时间段、不同的单元中抽取随机样本,即我们抽取的每个样本将由不同的个体填充。这通常用于查看政策或计划的影响。例如,我们将在 1990 年获取家庭 X、Y 和 Z 的家庭收入数据。然后我们将在 1995 年获取家庭 G、F 和 A 的相同收入数据。尽管我们对相同的数据感兴趣,但我们正在获取不同时期的不同样本(使用不同的住户)。

纯面板数据中,随着时间的推移,我们关注的是相同的单位,即相同的家庭或个人。例如,我们将追踪同一组家庭 X、Y 和 Z,对于我们收集的每个时间段的数据,即 1990 年的数据,我们还将在 1995 年采访相同的家庭。

因此,根本区别只是我们观察数据的单位。

希望这可以帮助。

统计和计量经济学中的横截面数据或研究人群的横截面是一种一维数据集。横断面数据是指在同一时间点观察多个主体(如个人、公司或国家/地区)或不考虑时间差异而收集的数据。横截面数据的分析通常包括比较受试者之间的差异。例如,我们想要测量人群中当前的肥胖水平。我们可以从该人群(也称为该人群的横截面)中随机抽取 1,000 人的样本,测量他们的体重和身高,并计算该样本中有多少百分比被归类为肥胖。例如,我们的样本中有 30% 被归类为肥胖。这个横截面样本为我们提供了该人群的快照,在那个时间点。请注意,基于一个横截面样本,我们不知道肥胖是增加还是减少;我们只能描述目前的比例。横截面数据不同于时间序列数据,也称为纵向数据,后者跟随一个主题随时间的变化。另一种变体,面板数据(或时间序列横截面 (TSCS) 数据)将两者结合起来,研究多个主题以及它们如何随时间变化。面板分析使用面板数据来检查变量随时间的变化以及受试者之间变量的差异。在滚动横截面中,样本中个体的存在和个体被包含在样本中的时间都是随机确定的。例如,一项政治民意调查可能决定采访 100,000 个人。它首先从整个种群中随机选择这些个体。然后它为每个人分配一个随机日期。这是该人将被采访的随机日期,因此被包括在调查中。

基于 Corey 的定义,我们采用以下方法来估计合并的横截面数据和面板数据的模型。

合并横截面:单向固定效应或随机效应(仅时间)或仅合并 OLS。

面板数据:两种(或一种)方式的固定效应/随机效应(时间或个人或两者)或合并 OLS。