我看不到使用 delta 方法的方法,但是...
阅读关于经验分布函数的收敛性,我们读到中心极限定理给了我们:
n−−√(F^n(x)−F(x))→N(0,F(x)(1−F(x)))
我们可以使用它来围绕每个创建不同的 CIF^n(x):
F^n(x)±1.96F^n(x)(1−F^n(x))n,
自从E(F^n(x))=F(x),F^n(x)是我们最好的估计F(x).
使用以下 R 代码:
#confidenc ebands calculation:
sim_norm<-rnorm(100)
plot(sim_norm)
hist(sim_norm)
sim_norm_sort<-sort(sim_norm)
n = sum(!is.na(sim_norm_sort))
plot(sim_norm_sort, (1:n)/n, type = 's', ylim = c(0, 1),
xlab = 'sample', ylab = '', main = 'Empirical Cumluative Distribution')
# Dvoretzky–Kiefer–Wolfowitz inequality:
# P ( sup|F_n - F| > epsilon ) leq 2*exp(-2n*epsilon^2)
# set alpha to 0.05 and alpha=2*exp(-2n*epsilon^2):
# --> epsilon_n = sqrt(-log(0.5*0.05)/(2*n))
#
#lower and upper bands:
L<-1:n
U<-1:n
epsilon_i = sqrt(log(2/0.05)/(2*n))
L=pmax(1:n/n-epsilon_i, 0)
U=pmin(1:n/n+epsilon_i, 1)
lines(sim_norm_sort, U, col="blue")
lines(sim_norm_sort, L, col="blue")
#using clt:
U2=(1:n/n)+1.96*sqrt( (1:n/n)*(1-1:n/n)/n )
L2=(1:n/n)-1.96*sqrt( (1:n/n)*(1-1:n/n)/n )
lines(sim_norm_sort, L2, col="red")
lines(sim_norm_sort, U2, col="red")
我们得到:

我们看到红色带(来自 CLT 方法)为我们提供了更窄的置信带。
编辑:正如@Kjetil B Halvorsen 指出的那样——这两种类型的乐队是不同的类型。我让@Glen_b 准确解释了他的意思:
非常不同种类的置信区间。使用逐点置信带,即使是从中提取数据的分布,您也会期望在带外有许多点。与同时乐队,你不会。如果您有 95% 的逐点带,则平均 5% 的正确分布点将在带之外。对于同时带,有 5% 的机会,最大偏差的点在外面。
非常感谢两者!