这些的估计量是渐近正态分布的吗?磷( X<是)P(X<Y)

机器算法验证 可能性 置信区间 渐近的
2022-04-06 00:45:03

我有两个连续的随机变量,它们的分布是未知的。我可以从中抽取样本,特别是,我有兴趣根据这些样本假设每个样本有元素:来自来自XYP(X<Y)nx1,x2,,xnXy1,y2,,ynY

我可以使用 作为如果我假设是独立的并且这样的估计量是渐近正态分布的吗?如果我知道

T=1n2i=1nj=1nI(xi<yj)
P(X<Y)XY

另外,如果我假设是相关的,我可以使用作为所述概率的估计量并且是它渐近正态分布?XY

S=1ni=1nI(xi<yi)

我问的是渐近正态性,因为我想确定的下限和上限,并认为置信区间可以起到这样的作用。P(X<Y)

PS如果为真,I(E)=1E0

2个回答

统计量统计量的一个示例,由 Hoeffding 在其 1948 年的论文A 类渐近正态分布的统计量中引入。此外,它是该类中最著名的,即Mann-Whitney U 检验它的均方误差低于,因为它等于,由于阶数统计足够, 可以应用Rao-Blackwell 定理。此外,它是正态分布的,这是从 U 统计量的一般定理得出的事实章节TUSE(SX(1),X(2),,Y(1),Y(2),)UU- 统计数据,例如 Lehmann 的大样本元素理论 或 Serfling 的数理统计近似定理可以在维基百科上找到它的有限分布,并进行少量样本修正。, 它是通过函数在 R 中实现的(带有选项)。wilcox.testpaired=FALSE

请注意,Mann-Whitney U 检验的定义不明确。有时它被定义为上面的,但有时它会将“的胜利”计为正数,将“的胜利数”计为负数。这是在例如 R 函数中采用的方法。Txiyiwilcox.test

对于两个估计量都是渐近正态的,这是一个相当直接和直观的论点。

调用

T(X|y1)=1ni=1nI(xi>y1)

一样,中心极限定理意味着这是渐近正态的。S

此外,取

T=1ni=1nT(X|yi)

由于每个是渐近正态的,并且正态变量的任何线性组合都是正态的,也必须是渐近正态的。T(X|yi)T