假设我有 iid 样本来自一些未知的分布我想估计平均值那个分布,我坚持估计是无偏的——即,.
典型估计量是样本均值. 这始终是无偏的,并且对于许多分布族,例如高斯分布,它在方差方面是最优的或接近最优的。
但是,样本均值并不稳健。特别是,如果单个样本均值可以任意变化被改变。这意味着它的故障点为 0。
更稳健的估计量是样本中位数。对于大多数样本而言,更改几个数据点不会显着改变中位数。这具有 0.5 的击穿点,这是可能的最高值。
对于高斯数据,样本中位数的方差高于样本均值(高出一个因子)。但是,对于其他分布,例如拉普拉斯分布或学生分布-distribution,中位数的方差实际上低于均值。
此外,如果分布是对称的(关于其均值),则中位数始终是无偏的。许多自然分布是对称的,但也有很多不是,例如以下示例。
我的问题是:对于自然不对称分布的均值,是否存在稳健且无偏的估计器?健壮是指非零故障点,自然是指上述列表或类似列表中的某些内容(只是不是虚构的示例)。我找不到任何例子。我会对二项式案例特别感兴趣。