线性回归:任何非正态分布给出 OLS 和 MLE 的同一性?

机器算法验证 回归 正态分布 数理统计 最大似然 最小二乘
2022-02-10 16:35:49

这个问题的灵感来自这里评论中的长时间讨论: 线性回归如何使用正态分布?

在通常的线性回归模型中,为简单起见,这里只写了一个预测变量: 其中是已知常数,而是零均值独立误差项。如果我们另外假设误差的正态分布,那么通常的最小二乘估计量和的最大似然估计量是相同的。

Yi=β0+β1xi+ϵi
xiϵiβ0,β1

所以我的简单问题是:误差项是否存在任何其他分布,使得 mle 与普通最小二乘估计量相同?一种含义很容易显示,另一种则不然。

3个回答

在最大似然估计中,我们计算

β^ML:lnf(ϵi)β=0f(ϵi)f(ϵi)xi=0

最后一个关系考虑到回归方程的线性结构。

相比之下,OLS 估计量满足

ϵixi=0

为了获得斜率系数的相同代数表达式,我们需要有一个误差项的密度,使得

f(ϵi)f(ϵi)=±cϵif(ϵi)=±cϵif(ϵi)

这些是形式的微分方程y=±xy有解决方案的

1ydy=±xdxlny=±12x2

y=f(ϵ)=exp{±12cϵ2}

任何具有此内核并在适当域上积分为单位的函数都将使斜率系数的 MLE 和 OLS 相同。即我们正在寻找

g(x)=Aexp{±12cx2}:abg(x)dx=1

是否有这样的不是正态密度(或半正态或误差函数的导数)? g

当然。但是还有一件需要考虑的事情是:如果在指数中使用加号,并且例如在零附近使用对称支持,则将获得一个在中间具有唯一最小值的密度,并且在支持的边界。

如果我们将 OLS 定义为

argβ0,β1mini=1n(yiβ0β1xi)2
任意密度使得 是可以接受的。这意味着例如 形式的密度 是可以接受的因为因子不依赖于参数因此,这样的分布是无限的。f(y|x,β0,β1)
argβ0,β1mini=1nlog{f(yi|xi,β0,β1)}=argβ0,β1mini=1n(yiβ0β1xi)2
f(y|x,β0,β1)=f0(y|x)exp{ω(yiβ0β1xi)2}
f0(y|x)(β0,β1)

两个估计量一致的另一个设置是当数据来自球对称分布时,即当(向量)数据具有条件密度其中是一个递减函数。(在这种情况下,OLS 仍然可用,尽管的独立性假设仅在 Normal 情况下成立。)y

h(||yXβ||)
h()ϵi

直到@Xi'an 刚刚更新了答案,我才知道这个问题。有一个更通用的解决方案。具有某些参数的指数族分布对 Bregman 散度的影响是固定的。对于这样的分布,均值是最小值。OLS 最小化器也是均值。因此,对于所有此类分布,当线性泛函与平均参数相关时,它们应该一致。

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.75.6958&rep=rep1&type=pdf

在此处输入图像描述