样本分位数的中心极限定理

机器算法验证 分位数 中心极限定理
2022-04-01 10:57:21

我正在阅读 Ruppert 的《金融工程统计和数据分析》,其中包含以下定理:

, ,是一个具有 CDF的独立同分布样本。假设具有密度处是连续且正的 ,0 < < 1。那么对于大,样本分位数近似正态分布,均值等于总体分位数,方差等于:Y1...YnFFfF1(q)qnqthF1(q)

q(1q)n[f(F1(q))]2

但是,考虑具有均值和方差的正态密度。的均值分布;样本将具有均值和方差如果我理解正确,对于 q = 0.5,上述公式给出的方差为 μσ2nμσ2/n

πσ22n

我在这里想念什么?任何见解都值得赞赏。

2个回答

正如@whuber 在评论中所说,您引用的样本分位数方差的公式是正确的,就像您在正常情况下给出的样本中位数一样。样本均值和样本中位数有不同的分布,实际上中位数在正常情况下具有更高的方差。

在 R 中,您可以估计正常情况下样本中位数的 SD,如下所示:

n <- 100; n.rep <- 1000
x <- matrix(rnorm(n*n.rep), ncol=n)
sd(apply(x, 1, median)) # 0.126

对于,方差当然是 1。对于,我们可以显示对于较大的 ,您的估计从我的实验中看起来非常好: n=1n=313/πnπ/(2n)方差