机器算法验证 - 确定重尾分布式过程是否已显着改进 - 吾爱随笔录

确定重尾分布式过程是否已显着改进

机器算法验证采样非参数

2022-03-25 23:32:19

我观察变更前后流程的处理时间，以了解流程是否因变更而有所改善。如果减少处理时间，则该过程已得到改善。处理时间的分布是肥尾的，因此基于平均值进行比较是不明智的。相反，我想知道在更改后观察到较低处理时间的概率是否显着高于 50%。

令为更改后处理时间的随机变量，为更改前的处理时间。如果明显高于，那么我会说这个过程有所改进。 $X$ $Y$ $P(X < Y)$ $0.5$

现在我有观察的和个观察的。的观察概率是。 $n$ $x_i$ $X$ $m$ $y_j$ $Y$ $P(X < Y)$ $\hat p = \frac{1}{n m} \sum_i \sum_j 1_{x_i < y_j}$

给定观察和，我能对说些什么？ $P(X < Y)$ $x_i$ $y_j$

3个回答

的问题提供了一个（很好的）标准解决方案，这被称为应力强度模型。 $\theta=P(X<Y)$

Baklizi 和 Eidous (2006)和独立的情况提出了另一种非参数替代方案。这在下面描述。 $X$ $Y$

根据定义，我们有

θ = P (X < Y) = \int_{- \infty}^{\infty} F_{X} (y) f_{Y} (y) d y,

$\theta=P(X<Y)=\int_{-\infty}^{\infty}F_X(y)f_Y(y)dy,$

其中的 CDF，f_YY 的。然后，使用和的样本，我们可以得到和的核估计量，的估计量 $F_X$ $X$ $f_Y$ $Y$ $X$ $Y$ $F_X$ $f_Y$ $\theta$

\hat{θ} = \int_{- \infty}^{\infty} {\hat{F}}_{X} (y) {\hat{f}}_{Y} (y) d y .

$\hat\theta=\int_{-\infty}^{\infty}\hat F_X(y)\hat f_Y(y)dy.$

这是使用高斯内核在以下 R 代码中实现的。

# Optimal bandwidth
h = function(x){
n = length(x)
return((4*sqrt(var(x))^5/(3*n))^(1/5))
}

# Kernel estimators of the density and the distribution
kg = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(dnorm((x[i]-data)/hb))/hb
return(r )
} 

KG = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(pnorm((x[i]-data)/hb))
return(r )
} 

# Baklizi and Eidous (2006) estimator
nonpest = function(dat1B,dat2B){
return( as.numeric(integrate(function(x) KG(x,dat1B)*kg(x,dat2B),-Inf,Inf)$value))  
}

# Example when X and Y are Cauchy
datx = rcauchy(100,0,1)
daty =  rcauchy(100,0,1)

nonpest(datx,daty)

为了获得的置信区间，您可以得到这个估计器的引导样本，如下所示。 $\theta$

# bootstrap
B=1000
p = rep(0,B)

for(j in 1:B){
dat1 =  sample(datx,length(datx),replace=T)
dat2 =  sample(daty,length(daty),replace=T)
p[j] = nonpest(dat1,dat2)
}

# histogram of the bootstrap sample
hist(p)

# A confidence interval (quantile type)
c(quantile(p,0.025),quantile(p,0.975))

也可以考虑其他类型的引导间隔。

您的估计等于 Mann-Whitney统计量除以（感谢 Glen！），因此等价于 Wilcoxon 秩和统计量（也称为 Wilcoxon-Mann-Whitney 统计量）：，其中是的样本大小（假设没有关系。）因此，您可以使用 Wilcoxon 测试的表格/软件并将它们转换回得到置信区间或值。 $\hat{p}$ $U$ $mn$ $W$ $W = U + {n(n+1)\over{2}}$ $n$ $y$ $U$ $p$

令为的样本大小， =。然后，渐近地， $m$ $x$ $N$ $m+n$

$W^* = \frac{W-\frac{m(N+1)}{2}}{\sqrt{\frac{mn(N+1)}{12}}} \sim \text{N}(0,1)$

资料来源： Hollander 和 Wolfe，非参数统计方法，大致 p。117，但可能大多数非参数统计书籍都会让你到达那里。

考虑配对差 , 然后 for是iid Bernoulli 随机变量。所以是二项式。那么是概率和置信区间的无偏估计，假设检验可以基于二项式进行。 $X_i-Y_i$ $P(X_i-Y_i<0) = p$ $I\{X_i-Y_i<0\}$ $i=1,2,..,n$ $X$ $X_i < Y_i$ $n$ $p=P(X_i-Y_i<0)$ $X/n$

其它你可能感兴趣的问题

上一篇置信区间和概率——这句话的错误在哪里？下一篇Var[s2]=σ4(2n−1+κn)Var[s2]=σ4(2n−1+κn) 的参考？