较重的尾部意味着它对逻辑和概率的外围数据不太敏感

机器算法验证 物流 广义线性模型 概率
2022-04-12 08:55:01

这是generalized linear model来自wiki的逻辑回归和概率回归的描述:

逻辑分布和正态分布都是对称的,具有基本的单峰“钟形曲线”形状。唯一的区别是逻辑分布的尾部稍重,这意味着它对异常数据不太敏感(因此对模型错误规格或错误数据更稳健)。

我不明白结论somewhat heavier tails, which means that it is less sensitive to outlying data较重的尾巴意味着极值(异常值)的概率相对较高。为什么我们说它对极端值不那么敏感?

1个回答

该声明不是关于从逻辑或正态生成极值,而是关于尝试将逻辑或正态拟合到可能具有极值的预先存在的数据。

你有数据,你正试图为它拟合一个模型。但是,如果某个数据点在某种意义上被模型“预期”,则它不是异常值。从逻辑分布的角度来看,数据中的任何极值都比从正态分布的角度来看更有可能,因此,参数估计不会被移动太多以试图“解释”(拟合) 他们。这可以重申,因为当我们使用逻辑分布时,参数估计对异常值的敏感性低于使用正态分布时的敏感性。