将 CLT 应用于随机变量的总和是否是一个很好的近似值?

机器算法验证 中心极限定理 近似
2022-03-17 04:08:43

我使用来表示具有平均和方差的分布,添加表示正态分布。(μ,σ2)μσ2N

假设中心极限定理 (CLT) 的正式陈述说 这里 讨论的语句 不是关于分布收敛的语句,而是而是一个近似值。时,这个近似值经常被认为是一个相当不错的近似值X1,,Xniid(μ,σ2)σ2<

X¯nμσ/ndN(0,1).
X¯nN(μ,σ2/n)
n30

现在,理论上,我们可以更进一步说 是来自 CLT 的近似声明。

(1)i=1nXiN(nμ,nσ2)

鉴于不是实际的 CLT,我想知道这个近似值的性能如何。总体表现是否良好?老实说,在分布特别偏斜的情况下,我会担心这一点。(1)

如果这太宽泛,我可以关闭它。

1个回答

反过来说,如果 Z 分数确实是标准正态分布,那么您随后的近似值将是准确的。误差程度应该与 Z 分数分布和标准高斯分布之间的距离的某种度量值大致成比例。

我们可以使用 KS 距离作为我们在 CDF 空间中的度量。假设我们将收集个样本的 Z 分数的(未知)真实样本 CDF 的KS 距离为NNϵNmaxz|FZn(z)FΦ(z)|=ϵN

现在,从其中只涉及尺度和位置的移动(即的参数的 )。这同样适用于将获得与实际总体具有相同均值和方差的正态随机变量的总和。实际上,您将对两个变量进行完全相同的转换,因此我们将简单地映射并类似 -- 因为我们对每个分布的参数进行相同的转换,所以我们将保留垂直距离。FZn(z)FSn(s)Sn=1NXiLzFZn(z)FΦ(z)FZn(z)FZn(L1z)FΦ

因此,相同的速率收敛到零但是,没有限制分布(它基本上是,这不是一个分布),而收敛到一个实际的分布函数。FSnFZnFSnF(x)=0.5FZn