您描述的问题是解释问题,而不是有效性问题。您的常数估计器的引导偏差估计并非无效,它实际上是完美的。
偏差的引导估计介于估计量和参数其中是某个未知分布,的样本。如果您手头有人口,您原则上可以计算函数有时我们取使用经验分布代替的插件估计。这大概就是你上面描述的。在所有情况下,偏差的引导估计为
其中θ^=s(x)θ=t(F),FxFt(F)s(x)=t(F^),t(F)F^F
biasF^=EF^[s(x∗)]−t(F^),
x∗的引导样本。x
常数是对同一常数的完美插件估计:c 总体是,样本是经验分布,它近似于。如果你可以评估,你会得到。当您计算插件估计时,您还会得到。如您所料,没有偏见。∼F∼F^Ft(F)=cct(F^)=cc
插件估计中存在偏差的一个众所周知的情况是估计方差,因此是 Bessel 校正。下面我演示一下。引导偏差估计还不错:
t(F^)
library(plyr)
n <- 20
data <- rnorm(n, 0, 1)
variance <- sum((data - mean(data))^2)/n
boots <- raply(1000, {
data_b <- sample(data, n, replace=T)
sum((data_b - mean(data_b))^2)/n
})
# estimated bias
mean(boots) - variance
#> [1] -0.06504726
# true bias:
((n-1)/n)*1 -1
#> [1] -0.05
我们可以取而代之,将作为总体均值和,在大多数情况下应该存在明显偏差的情况:
t(F)s(x)=c
library(plyr)
mu <- 3
a_constant <- 1
n <- 20
data <- rnorm(n, mu, 1)
boots <- raply(1000, {
# not necessary as we will ignore the data, but let's do it on principle
data_b <- sample(data, n, replace=T)
a_constant
})
# estimated bias
mean(boots) - mean(data)
#> [1] -1.964877
# true bias is clearly -2
同样,自举估计也不算太糟糕。