机器算法验证 - 均匀分布最大值的蒙特卡洛置信区间方法？ - 吾爱随笔录

均匀分布最大值的蒙特卡洛置信区间方法？

机器算法验证置信区间引导程序蒙特卡洛

2022-04-20 08:24:48

如果有样本来自具有 pdf的连续均匀分布，那么它众所周知，的 MLE是。 $n$ $X_1 \leq X_2 \leq ... \leq X_n$ $f(x)=\frac{1}{\theta},0\leq x \leq \theta$ $\theta$ $\hat{\theta}=X_n$

但是，如果使用 bootstrap 估计的置信区间，我们会看到置信区间类似于。 $\hat{\theta}=X_n$ $[aX_n,X_n], 0< a < 1$

我想知道是否有一种蒙特卡洛方法可以提供更合理的置信区间，可能类似于？ $[X_n,bX_n],b>1$

2个回答

是的，这是引导程序不一致的典型示例，但二次采样会产生有效的推理。参见Swanepoel (1986)、Politis 和 Romano (1994)或Canty 等。人。（2006 年）。

为什么不直接使用置信区间的定义？

您寻求一个置信上限 $\theta$ , 说 $1-\alpha$ 覆盖范围。因为这无异于估计一个规模和 $X_n$ 是你的测试统计，你应该寻找一个 UCL 的形式 $cX_n$ 对于一些普遍的常数 $c$ . 这一切意味着（根据定义）是

1 - α = {Pr}_{θ} [c X_{n} \geq θ] = {Pr}_{θ} [X_{n} \geq θ / c] = 1 - {(\frac{1}{c})}^{n} .

$1-\alpha = {\Pr}_\theta[c X_n \ge \theta] = {\Pr}_\theta[X_n \ge \theta/c] = 1-\left(\frac{1}{c}\right)^n.$

解决方案是。 $c = \alpha^{-1/n}$

有趣的是，可以以相同的方式找到的置信下限，形式 with。这个置信区间从不包含！ $\theta$ $b X_n$ $b = (1-\alpha)^{-1/n}$ $\hat{\theta} = X_n$

例如，假设并且我们寻求（对称的）两侧 95% 置信区间，因此。因此和：我们有 95% 的信心认为，底层均匀分布的极限位于从该分布中提取的 10 个 iid 中最大值的 1.446 到 1.003 倍之间。 $n=10$ $\alpha = 0.025$ $c=1.446126$ $b=1.002535$ $\theta$

作为测试（在 R 中）：

# Specify the confidence.
alpha <- 1 - 0.95

# Create simulated values.
n <- 10                                 # Number of iid draws per trial
nTrials <- 10000                        # Number of trials
theta <- 1                              # Parameter (positive; its value doesn't matter)
set.seed(17)
x <- runif(n*nTrials, max=theta)        # The data
xn <- apply(matrix(x, nrow=n), 2, max)  # The test statistics

# Compute the coverage of the simulated intervals.
ucl.k <- (alpha/2)^(-1/n)
lcl.k <- (1-alpha/2)^(-1/n)
length(xn[lcl.k * xn <= theta & theta <= ucl.k * xn]) / nTrials

这个（可重现的）示例产生 95.05%，尽可能接近 95% 的标称覆盖率。

其它你可能感兴趣的问题

上一篇如何获得 nls 函数的 p 值和置信区间？下一篇解析 n-gram 的文本时 - 是否应包括标点符号？