术语:无条件异方差

机器算法验证 术语 异方差 定义
2022-03-25 23:03:26

我见过提到无条件和有条件的异方差。后者对我来说很好,但我很难理解前者。看来我不是唯一一个质疑无条件异方差性的人。@whuber 最近的评论如下:

异方差的字面意思是“不同数量的分散”。它纯粹是描述性地应用于数据,例如,其中一个数据子组可能与另一个(不相交的)子组具有显着不同的分布。它可能适用于时间序列(它是一种特殊类型的弱二阶平稳性失效)。但它的一般意义是分散变化,这意味着它取决于某些东西,在这方面,形容词“无条件”看起来像一个矛盾的说法。

在某些情况下,非条件异方差和条件异方差之间的对比似乎在于条件集的大小。例如,在时间序列上下文中,无条件异方差似乎是不以模型中的任何变量而是时间指数为条件的异方差(因此,尽管名称如此,它实际上似乎是有条件的)同时,模型中某些变量的条件异方差条件。

对无条件异方差一词感到满意的人可以解释一下吗?

1个回答

您可以将其视为“不依赖于模型明确识别的变量的异方差”的简写。

在更实际的意义上,它是“不依赖于我们拥有数据的变量的异方差”。

因此,“条件异方差”将是“确实取决于……的异方差”

询问一个术语的哲学意义总是一件好事,但有时,关于使用标签进行交流的功利主义考虑会接管。


对评论的回应
假设我们正在检查特定行业在特定时间段和地理区域的产出,并拥有一个包含与生产(产出、投入)相关的数据的横截面样本。我们很确定我们有关于所有输入的数据,我们考虑模型x

Qi=F(xi)+εi

代表什么很多事情,但是(结构推理)基于我们对行业和具体市场的了解,我们可以肯定:客户对这个行业的产品的偏好和需求取决于客户是住在城市还是在国家。特别是,城市居民的偏好更加不稳定,追逐最新的时尚等,而乡村居民的偏好更加稳定。每家公司都有不同的客户群,包括城市和国家。这意味着我们预计(结构推理)误差项会根据每个公司的客户组合(观察)而有所不同。εi

对此知识进行建模的一种方法是假设一个经典的零均值、独立、同方差等,扰动表示当客户群仅限城市时的误差项,然后考虑一个变量,它反映每个公司的城市客户比例,并设置uimi[0,1]

εi=miui.

变量至少是当事方确定性的,因为它直接受到每个公司的营销/管理决策的影响。还假设的任何部分是随机的,在统计上与输入没有关联。mimi

情况A:无条件异方差(有效)

假设您的样本不包含上的数据。在这种情况下,回归误差在给定的情况下是条件异方差的,但您对此无能为力。此外,由于是确定性的,因此您最终会得到一个无条件的异方差误差项。mimimi

情况 B:条件异方差(可实现)

现在假设您有一个关于变量的数据系列。然后你可以有效地调节例如,在具有线性回归函数设置的 OLS 估计中,我们将得到mimi

Var(β^X,m)=σu2(XX)1[Xdiag{mi2}X](XX)1

情况 C:聚类标准错误(“组别异方差”的继承者)

现在假设您没有关于的数据,而是有一个分类变量,它根据客户组合将观察结果元分类为三组:“更面向国家”、“更面向城市”、“平衡”。然后你可以对这个变量做一些事情,并基于它实现一个“聚集标准误差”估计,至少在一定程度上捕捉到来自客户组合的可变性。mi