指数修正高斯分布的稳健参数估计

机器算法验证 分布 估计 异常值 强大的
2022-04-04 02:46:19

我想测试我的数据可以通过指数修改高斯分布(维基百科)正态指数伽马(NEG)分布建模的效果。但是,当数据集中存在异常值时,参数估计(涉及偏度)不是很稳健。

我对此数据集的基于中值的参数估计有很好的经验(请参阅相关问题估计正态分布的参数:中值而不是平均值?)。

您知道 ExGaussian / NEG 分布的基于中值或类似稳健的参数估计吗?我已经尝试过修剪我的数据集,之后的结果显然更好。然而,这显然引入了一种偏见,我需要以某种方式纠正它。

1个回答

如果看起来大多数异常值都在最右边,您可以决定一个阈值,包括左侧的大部分数据点,并审查该阈值右侧的所有值。这类似于修剪,但不会引入偏差。我不知道您将如何在经典统计框架中运行这样的分析,但使用贝叶斯统计“非常容易”