我有一堆(大约 1000 个)估计值,它们都应该是对长期弹性的估计值。其中超过一半是使用方法 A 估计的,其余使用方法 B 估计。在某处我读到类似“我认为方法 B 估计的东西与方法 A非常不同的东西,因为估计要高得多 (50-60%) ”。我对稳健统计的了解几乎为零,所以我只计算了两个样本的样本均值和中位数......我立即看到了差异。方法A非常集中,中位数和均值之间的差异很小,但方法B样本变化很大。
我得出的结论是异常值和测量误差歪曲了方法 B 样本,因此我丢弃了大约 50 个与理论非常不一致的值(约 15%)……突然间,两个样本(包括它们的 CI)的均值非常相似. 密度图也是如此。
(为了消除异常值,我查看了样本 A 的范围,并删除了 B 中所有超出范围的样本点。)我希望您告诉我在哪里可以找到一些稳健估计均值的基础知识请允许我更严格地判断这种情况。并有一些参考。我不需要对各种技术有非常深入的了解,而是通读对稳健估计方法的全面调查。
在去除异常值后,我对平均差异的显着性进行了 t 检验,p 值为 0.0559(t 约为 1.9),对于完整样本,t stat 约为 4.5。但这并不是重点,手段可能会有所不同,但它们不应相差 50-60%,如上所述。我不认为他们这样做。