我偶然发现了这个非常好的博客。
http://www.statisticssolutions.com/assumptions-of-linear-regression/
它已经提到-“线性回归分析要求所有变量都是多元正态的”。
我认为正态分布的假设是针对残差的。我知道偏斜的数据会扭曲显着性检验,因此最好拥有正态分布的数据。但是我们可以说“变量的正态分布”是线性回归的假设之一吗?
我对此感到困惑。有人可以解释一下吗?
我偶然发现了这个非常好的博客。
http://www.statisticssolutions.com/assumptions-of-linear-regression/
它已经提到-“线性回归分析要求所有变量都是多元正态的”。
我认为正态分布的假设是针对残差的。我知道偏斜的数据会扭曲显着性检验,因此最好拥有正态分布的数据。但是我们可以说“变量的正态分布”是线性回归的假设之一吗?
我对此感到困惑。有人可以解释一下吗?
作为一般断言,这完全是错误的,我非常同意@Glen_b。有关经典线性模型假设的回顾,请参见此
但本质上,误差项的正态性确保的分布是完全正态的。而不是仅仅通过 t 分布来近似。请注意下面的评论,关于估计标准误差时的分布。
我不知道为什么网页会说,说的是什么。要说明为什么不需要正态性,您可以自己推导出估计量(或在线查找)。OLS(通常必须)通过矩量法得出-正态性在这些方程中没有任何位置。
也许这是对最大似然法的误解,至少 OLS MLE 假设正态性。然而,它不是必需的,因为估计对这个假设(准 MLE)是完全稳健的。