这个问题的灵感来自这里评论中的长时间讨论: 线性回归如何使用正态分布?
在通常的线性回归模型中,为简单起见,这里只写了一个预测变量: 其中是已知常数,而是零均值独立误差项。如果我们另外假设误差的正态分布,那么通常的最小二乘估计量和的最大似然估计量是相同的。
所以我的简单问题是:误差项是否存在任何其他分布,使得 mle 与普通最小二乘估计量相同?一种含义很容易显示,另一种则不然。
这个问题的灵感来自这里评论中的长时间讨论: 线性回归如何使用正态分布?
在通常的线性回归模型中,为简单起见,这里只写了一个预测变量: 其中是已知常数,而是零均值独立误差项。如果我们另外假设误差的正态分布,那么通常的最小二乘估计量和的最大似然估计量是相同的。
所以我的简单问题是:误差项是否存在任何其他分布,使得 mle 与普通最小二乘估计量相同?一种含义很容易显示,另一种则不然。
在最大似然估计中,我们计算
最后一个关系考虑到回归方程的线性结构。
相比之下,OLS 估计量满足
为了获得斜率系数的相同代数表达式,我们需要有一个误差项的密度,使得
这些是形式的微分方程有解决方案的
任何具有此内核并在适当域上积分为单位的函数都将使斜率系数的 MLE 和 OLS 相同。即我们正在寻找
是否有这样的不是正态密度(或半正态或误差函数的导数)?
当然。但是还有一件需要考虑的事情是:如果在指数中使用加号,并且例如在零附近使用对称支持,则将获得一个在中间具有唯一最小值的密度,并且在支持的边界。
如果我们将 OLS 定义为
两个估计量一致的另一个设置是当数据来自球对称分布时,即当(向量)数据具有条件密度其中是一个递减函数。(在这种情况下,OLS 仍然可用,尽管的独立性假设仅在 Normal 情况下成立。)
直到@Xi'an 刚刚更新了答案,我才知道这个问题。有一个更通用的解决方案。具有某些参数的指数族分布对 Bregman 散度的影响是固定的。对于这样的分布,均值是最小值。OLS 最小化器也是均值。因此,对于所有此类分布,当线性泛函与平均参数相关时,它们应该一致。
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.75.6958&rep=rep1&type=pdf