中位数的置信区间

机器算法验证 标准差 引导程序 标准错误 中位数
2022-03-30 03:15:42

我有一组价值观xi,i=1,,N其中我计算了中位数 M。我想知道如何计算这个估计的误差。

在网上我发现它可以计算为1.2533σN在哪里σ是标准差。但我没有找到关于它的参考资料。所以我不明白为什么..有人可以向我解释一下吗?

我在想我可以使用引导程序来估计错误,但我想避免它,因为它会大大减慢我的分析速度。

我也在考虑以这种方式计算中位数的误差

δM=i(xiM)2N1

是否有意义?

2个回答

要直接处理中位数的误差,您可以使用中位数的精确非参数置信区间,它使用顺序统计。如果您想要一些不同的东西,即离散度的度量,请考虑基尼平均差。代码在这里用于中位数的置信区间。

正如另一个答案中所指出的,使用顺序统计的中位数有一个非参数 CI。那个 CI 在很多方面都比你在网上找到的要好。

现在,如果你必须知道1.2533σN因子来自哪里,答案是来自中位数的渐近分布。如果我们将样本中位数表示为θ~和人口中位数θ那么可以证明

n(θ~θ)LN(0,14[f(θ)]2)

在哪里f是您的样本的分布。结果不像 CLT 那样普遍,因为渐近分布仍然取决于样本的基本分布(通过术语[f(θ)]2)。但是,您可以非常简单地说明您的样本来自具有均值和中值的正态分布θ和方差σ2. 评估f然后在其对称点产生

[f(θ)]2=12πσ2

因此渐近方差变为

2π4σ2
.

被除以N并取其平方根以得出您的标准误差1.2533σN.