零协方差和零期望是否意味着零条件期望?

机器算法验证 最小二乘 条件期望 内生性
2022-03-30 15:52:30

是两个随机变量。如果那会导致xϵ

Cov(x,ϵ)=0
E[ϵ]=0,
E[ϵ|x]=0?

4个回答

这个数字是一个完整的答案。

数字

不过,对于那些想要在图上加以光泽的人来说,请注意,在这个包含 1,000 个(X,ε),

  • 。” 以零为中心时,就像它们在这里一样,协方差是它们的平均乘积。该图使用颜色来表示单个产品:绿色和蓝色表示非常负值,橙色表示略微正值。总的来说,许多橙色抵消了少数绿色和蓝色,从而产生零协方差。Cov(X,ε)=0Xε

  • 。” 平均而言,的值为零。从对称性中可以看出这一点:将图旋转 180 度保留了它的特征(下降到相当精细的细节),但否定了 因此平均值必须接近于零(唯一的有限数等于它自己的负数)。E[ε]=0εε.

条件期望 由粗黑色曲线描绘:在的每个值处,它估计位于该值之上的点的平均高度。显然这并不总是零。(在这个例子中,重要的是曲线并非始终为零:它的形状细节无关紧要。)E[εX]X

即使当的协方差为零且的期望值为零的值局部波动,前提是它们在全局(整体上)平均为零XεεεX,


附录

下面是R生成该图的代码。(长)第三行是它的核心:对于曲线函数它添加了均匀分布的误差,然后 - 确保结果响应与 - 消除对这些值的影响(使用调用序列)。y=sin(πx/3)runif(n, -1/2, 1/2)xxscale(residuals(lm(...)))

(如果你对这个预处理感到不舒服,那么在去掉的影响后添加错误:x:

eps <- runif(n, -1/2, 1/2) + residuals(lm(sin(pi*x/sqrt(3)) ~ x))

结果,因为误差真正独立于不会完全为零相关,而只是因为模拟中的机会变化。这提供了更好的模拟,但不能保证良好的情节!)x,

#
# Create data.
#
n <- 1e3                     # Specify the size of the dataset
x <- scale(runif(n))         # Create explanatory variable values
eps <- scale(residuals(lm(runif(n, -1/2, 1/2) + sin(pi*x/sqrt(3)) ~ x)))
zapsmall(cor(cbind(x, eps))) # Confirm lack of correlation
#
# Create a data frame for plotting and plot it.
#
X <- data.frame(x=x, eps=eps, Product=x*eps)
library(ggplot2)
ggplot(X, aes(x, eps)) +
  geom_hline(yintercept=0) + geom_vline(xintercept=0) +        # Draw axes
  geom_point(aes(fill=Product), size=2, shape=21, alpha=1/4) + # Plot the points
  geom_smooth(color="Black", se=FALSE, size=1.1) +             # Plot the regression
  scale_fill_gradientn(colors=topo.colors(13)[1:12]) +         # Specify colors
  ylab(expression(epsilon))                                    # Label an axis

现在检查相关时刻。x=ϵ=0

xϵ是两个随机变量。如果

Cov(x,ϵ)=0
E[ϵ]=0,
这会导致 E[ϵ|x]=0?

不,这些条件还不够。

确实有可能两者都成立,但Cov(x2,ϵ)0, 所以E[ϵ|x]0

但是,如果这种更强烈的条件成立Cov(f(x),ϵ)=0随便f(), 然后 E[ϵ|x]=0抓住

注意:有时E[ϵ|x]=0假定但仅E[xϵ]=0检查/考虑。如果我们假设(通常是隐含地)只允许线性关系,那么这个 prassi 就可以工作。

以下是错误的。这是一个反例

这是我的想法。有专家可以帮我检查一下吗?谢谢。

Cov(x,ϵ)=0 E[xϵ]E[x]E[ϵ]=0 E[ϵ]=0E[xϵ]=0

所以我们可以说xϵ是正交的。从几何的角度来看,E[ϵ|x]是的投影ϵ到 x 的平面上。自从ϵ与该平面正交,因此投影为零。那是E[ϵ|x]=0