我正在研究使用修剪后的平均值来测量各种分布的位置。这些分布有时会受到严重污染,有时不会。通常它们遵循类似于对数正态分布或可能混合对数正态分布的东西,但通常数据“无处不在”。
我查看了平均值、5% 修剪平均值、10% 修剪平均值和 20% 修剪平均值。对于每个我使用引导程序估计标准误差。
但令我惊讶的是,根据引导程序,平均值的标准误差通常低于 5% 的修剪平均值。因此,在大量数据集中,我发现从最低标准误差到最高标准误差是 20% 修剪,10% 修剪,平均,5% 修剪。
这个结果是非典型的,还是常见的?(请注意,在稳健统计和引导方面,我是初学者,所以我可能犯了一个基本的概念错误)。感谢您的任何提示。
跟进结果:我重新进行了练习,但数据更多。我总共应用了大约 4000 个数据集。结果如下
technique number of times lowest std error
mean 1867
5% trimmed 263
10% trimmed 430
20% trimmed 787
median 663
在这个新数据中,当平均值具有最低标准误差时,它只会稍微好一点,而当它表现不佳时,它的表现真的很差。因此,当我查看不同技术的所有数据集的平均标准误差时,结果可能与预期一致。
technique avg std error
mean 4.51
5% trimmed 4.33
10% trimmed 4.05
20% trimmed 3.78
median 4.36