机器算法验证 - 零协方差和零期望是否意味着零条件期望？ - 吾爱随笔录

零协方差和零期望是否意味着零条件期望？

机器算法验证最小二乘条件期望内生性

2022-03-30 15:52:30

设和是两个随机变量。如果且那会导致 $x$ $\epsilon$

C o v (x, ϵ) = 0

$Cov(x, \epsilon)=0$

E [ϵ] = 0,

$E[\epsilon]=0,$

E [ϵ | x] = 0 ?

$E[\epsilon|x]=0?$

4个回答

这个数字是一个完整的答案。

不过，对于那些想要在图上加以光泽的人来说，请注意，在这个包含 1,000 个 $(X,\varepsilon),$

“。” 当和以零为中心时，就像它们在这里一样，协方差是它们的平均乘积。该图使用颜色来表示单个产品：绿色和蓝色表示非常负值，橙色表示略微正值。总的来说，许多橙色抵消了少数绿色和蓝色，从而产生零协方差。 $\operatorname{Cov}(X,\varepsilon)=0$ $X$ $\varepsilon$
“。” 平均而言，的值为零。从对称性中可以看出这一点：将图旋转 180 度保留了它的特征（下降到相当精细的细节），但否定了因此平均值必须接近于零（唯一的有限数等于它自己的负数）。 $E[\varepsilon]=0$ $\varepsilon$ $\varepsilon.$

条件期望 由粗黑色曲线描绘：在的每个值处，它估计位于该值之上的点的平均高度。显然这并不总是零。（在这个例子中，重要的是曲线并非始终为零：它的形状细节无关紧要。） $E[\varepsilon\mid X]$ $X$

即使当和的协方差为零且的期望值为零的值局部波动，前提是它们在全局（整体上）平均为零。 $X$ $\varepsilon$ $\varepsilon$ $\varepsilon$ $X,$

附录

下面是R生成该图的代码。（长）第三行是它的核心：对于曲线函数它添加了均匀分布的误差，然后 - 确保结果响应与 - 消除对这些值的影响（使用调用序列）。 $y = \sin(\pi x/\sqrt{3})$ runif(n, -1/2, 1/2) $x$ $x$ scale(residuals(lm(...)))

（如果你对这个预处理感到不舒服，那么在去掉的影响后添加错误： $x:$

eps <- runif(n, -1/2, 1/2) + residuals(lm(sin(pi*x/sqrt(3)) ~ x))

结果，因为误差真正独立于不会完全为零相关，而只是因为模拟中的机会变化。这提供了更好的模拟，但不能保证良好的情节！） $x,$

#
# Create data.
#
n <- 1e3                     # Specify the size of the dataset
x <- scale(runif(n))         # Create explanatory variable values
eps <- scale(residuals(lm(runif(n, -1/2, 1/2) + sin(pi*x/sqrt(3)) ~ x)))
zapsmall(cor(cbind(x, eps))) # Confirm lack of correlation
#
# Create a data frame for plotting and plot it.
#
X <- data.frame(x=x, eps=eps, Product=x*eps)
library(ggplot2)
ggplot(X, aes(x, eps)) +
  geom_hline(yintercept=0) + geom_vline(xintercept=0) +        # Draw axes
  geom_point(aes(fill=Product), size=2, shape=21, alpha=1/4) + # Plot the points
  geom_smooth(color="Black", se=FALSE, size=1.1) +             # Plot the regression
  scale_fill_gradientn(colors=topo.colors(13)[1:12]) +         # Specify colors
  ylab(expression(epsilon))                                    # Label an axis

令。现在检查相关时刻。 $x = \epsilon = 0$

让 $x$ 和 $\epsilon$ 是两个随机变量。如果
$C o v (x, ϵ) = 0$ $Cov(x,\epsilon)=0$ 和 $E [ϵ] = 0,$ $E[\epsilon]=0,$ 这会导致 $E[\epsilon|x]=0?$

不，这些条件还不够。

确实有可能两者都成立，但 $Cov(x^2,\epsilon)\neq0$ ，所以 $E[\epsilon|x]\neq 0$

但是，如果这种更强烈的条件成立 $Cov(f(x),\epsilon)=0$ 随便 $f()$ ，然后 $E[\epsilon|x] = 0$ 抓住

注意：有时 $E[\epsilon|x] = 0$ 假定但仅 $E[x \epsilon] = 0$ 检查/考虑。如果我们假设（通常是隐含地）只允许线性关系，那么这个 prassi 就可以工作。

以下是错误的。这是一个反例：

这是我的想法。有专家可以帮我检查一下吗？谢谢。

$Cov(x, \epsilon)=0\space\implies E[x\epsilon]-E[x]E[\epsilon]=0 \space \stackrel{E[\epsilon]=0}\implies E[x\epsilon]=0$

所以我们可以说 $x$ 和 $\epsilon$ 是正交的。从几何的角度来看， $E[\epsilon|x]$ 是的投影 $\epsilon$ 到 x 的平面上。自从 $\epsilon$ 与该平面正交，因此投影为零。那是 $E[\epsilon|x]=0$

其它你可能感兴趣的问题

上一篇是否有一个典型的例子来说明岭何时胜过套索？下一篇解释 GAM 系数