您可以将其视为“不依赖于模型明确识别的变量的异方差”的简写。
在更实际的意义上,它是“不依赖于我们拥有数据的变量的异方差”。
因此,“条件异方差”将是“确实取决于……的异方差”
询问一个术语的哲学意义总是一件好事,但有时,关于使用标签进行交流的功利主义考虑会接管。
对评论的回应
假设我们正在检查特定行业在特定时间段和地理区域的产出,并拥有一个包含与生产(产出、投入)相关的数据的横截面样本。我们很确定我们有关于所有输入的数据,我们考虑模型x
Qi=F(xi)+εi
代表什么?很多事情,但是(结构推理)基于我们对行业和具体市场的了解,我们可以肯定:客户对这个行业的产品的偏好和需求取决于客户是住在城市还是在国家。特别是,城市居民的偏好更加不稳定,追逐最新的时尚等,而乡村居民的偏好更加稳定。每家公司都有不同的客户群,包括城市和国家。这意味着我们预计(结构推理)误差项会根据每个公司的客户组合(观察)而有所不同。εi
对此知识进行建模的一种方法是假设一个经典的零均值、独立、同方差等,扰动表示当客户群仅限城市时的误差项,然后考虑一个变量,它反映每个公司的城市客户比例,并设置uimi∈[0,1]
εi=miui.
变量至少是当事方确定性的,因为它直接受到每个公司的营销/管理决策的影响。还假设的任何部分是随机的,在统计上与输入没有关联。mimi
情况A:无条件异方差(有效)
假设您的样本不包含上的数据。在这种情况下,回归误差在给定的情况下是条件异方差的,但您对此无能为力。此外,由于是确定性的,因此您最终会得到一个无条件的异方差误差项。mimimi
情况 B:条件异方差(可实现)
现在假设您有一个关于变量的数据系列。然后你可以有效地调节。例如,在具有线性回归函数设置的 OLS 估计中,我们将得到mimi
Var(β^∣X,m)=σ2u(X′X)−1[X′diag{m2i}X](X′X)−1
情况 C:聚类标准错误(“组别异方差”的继承者)
现在假设您没有关于的数据,而是有一个分类变量,它根据客户组合将观察结果元分类为三组:“更面向国家”、“更面向城市”、“平衡”。然后你可以对这个变量做一些事情,并基于它实现一个“聚集标准误差”估计,至少在一定程度上捕捉到来自客户组合的可变性。mi