谁能解释观察到的变量和未观察到的变量之间的区别(最好用简单的英语)?
观察到的与未观察到的变量
观察到的变量是您在数据集中有测量值的变量,而未观察到的(或潜在的)变量是您没有测量的变量。
当您的分析揭示观察到的变量之间的相关性时,您可能会寻找未观察到的变量来解释相关性,尤其是在您怀疑它们之间存在直接因果关系的情况下。举一个人为的例子,假设您的数据集包括强相关变量“冰淇淋消费”和“空调使用”。您可能会怀疑存在一个未观察到的变量(温度),作为一个常见原因,推动了相关性。
有时未观察到的变量是未观察到的,因为它不能直接测量。(也许该变量本质上更具理论性,或者该变量原则上可以直接测量,但在实践中测量它会很困难/昂贵。)例如,我们不能直接测量智力,所以我们使用代理测量例如在智力测试中的表现作为替代品。
你在做经济学研究吗?通常,不可观察的特征是那些被误差项捕获的特征,并且会影响您的估计,例如通过异方差。让我给你一个例子。
当您进行所谓的对应测试时在劳动力市场研究招聘中的种族歧视,你发出虚假的匹配工作申请。一份申请涉及“红色”申请人,而另一份申请涉及“绿色”申请人(其中“绿色”和“红色”是两个种族)。种族是两个虚假申请人之间唯一可观察到的不同特征;但是,在申请中,对于两个申请人来说,还有许多其他相同的特征(嗯,实际上它们是等效的,并不完全相同),例如:达到的学习水平、年龄、工作经验等……所有这些特征是可以观察到的(从实验者和雇主的角度来看),因为它们列在简历中,而种族可以从申请人的名字中理解。
因此,雇主和实验者都无法观察到简历中未列出的其他特征。这些特征就是所谓的“不可观察的特征”。这些不可观察的特征将通过异方差性(=残差的不同方差,对于两个比较组)影响招聘歧视的估计。有关这一点的更多见解,请参阅这篇文章和这篇文章。
审计测试也出现了类似的问题在这里,实验者没有发送虚构的书面申请者,而是派了两名演员亲自申请面试。除了种族之外,这两位演员在所有特征上都匹配。然而,两个申请人之间会有不同的特征,实验者没有观察到,但雇主会观察到,在这种情况下,我们所说的也是不可观察的特征。例如,一个申请人的声音更悦耳,或者申请人在面试当天有点臭,或者没有正确梳理头发等等……虽然这些例子听起来很傻,但这些不同的不可观察的特征最终可能会决定两个虚假申请人的招聘决定存在系统性差异,从而导致结果存在偏差。