我想测试我的数据可以通过指数修改高斯分布(维基百科)或正态指数伽马(NEG)分布建模的效果。但是,当数据集中存在异常值时,参数估计(涉及偏度)不是很稳健。
我对此数据集的基于中值的参数估计有很好的经验(请参阅相关问题估计正态分布的参数:中值而不是平均值?)。
您知道 ExGaussian / NEG 分布的基于中值或类似稳健的参数估计吗?我已经尝试过修剪我的数据集,之后的结果显然更好。然而,这显然引入了一种偏见,我需要以某种方式纠正它。
我想测试我的数据可以通过指数修改高斯分布(维基百科)或正态指数伽马(NEG)分布建模的效果。但是,当数据集中存在异常值时,参数估计(涉及偏度)不是很稳健。
我对此数据集的基于中值的参数估计有很好的经验(请参阅相关问题估计正态分布的参数:中值而不是平均值?)。
您知道 ExGaussian / NEG 分布的基于中值或类似稳健的参数估计吗?我已经尝试过修剪我的数据集,之后的结果显然更好。然而,这显然引入了一种偏见,我需要以某种方式纠正它。
如果看起来大多数异常值都在最右边,您可以决定一个阈值,包括左侧的大部分数据点,并审查该阈值右侧的所有值。这类似于修剪,但不会引入偏差。我不知道您将如何在经典统计框架中运行这样的分析,但使用贝叶斯统计“非常容易”