是的,原则上,重采样可以帮助回答这个问题。
incumbent <- c(7.3, 8.4, 8.4, 8.5, 8.7, 9.1, 9.8, 11.0, 11.1, 11.9)
proposed <- c(17.3, 17.9, 19.2, 20.3, 20.5, 20.6, 21.1, 21.2, 21.3, 21.7)
set.seed(42)
M <- 2000
rs <- double(M)
for (i in 1:M) {
rs[i] <- mean(sample(proposed, replace=T)) - 2 * mean(sample(incumbent, replace=T))
}
要进行评估,您应该选择以下一项(而不是两项):
A. 使用霍尔方法的(加权)均值差异的(双尾)90% 置信区间为:
ci.hall <- 2 * (mean(proposed)-2*mean(incumbent)) - rev(quantile(rs,prob=c(0.05, 0.95)))
names(ci.hall) <- rev(names(ci.hall))
ci.hall
5% 95%
-0.29 2.95
如果您担心错过 mean(proposed) 实际上可能小于 2 * mean(incumbent) 的可能性,这是合适的。
B. 重新采样均值的比例 >= 0 提供了(单尾)估计,即均值(提议的)至少是均值(现任)的两倍:
sum(rs>=0)/M
[1] 0.8915
问题是样本非常小,对于小 n,重采样估计可能不稳定。如果您想评估正态性并进行参数比较,同样的问题也适用。
如果你可以达到,比如说,n >= 30,那么这里描述的方法应该没问题。