两个相关正态变量的最小值的平方是否具有卡方分布?

机器算法验证 分布 自习 正态分布 卡方分布
2022-03-24 10:29:30

如果随机变量XY均值正态分布μ=0和标准差σ=1,然后定义随机变量Z=min(X,Y). 问题是要证明Z2遵循带参数的伽马分布(α=1/2,λ=1/2)(即卡方分布)。

我有:

P(Z2z)=P((min{X,Y})2z)=P(zmin(X,Y)z)=P(zXz,zYz)
但我不确定从这里去哪里,因为随机变量不被认为是独立的。我将不胜感激任何提示!

2个回答

结果不正确。

作为反例,让(X,Y)具有 Clayton copula 的标准 Normal 边距,如https://stats.stackexchange.com/a/30205所示。如图左下角所示,生成 10,000 个独立实现的这种二元分布,产生 10,000 个实现Z2显然不遵循Γ(1/2,1/2)分布(在卡方拟合检验中,χ2=121,p<1016)。图顶部的 qq 图确认边缘看起来是标准的 Normal,而右下角的 qq 图表示边缘的上尾Z2太短了。

数字

该结果可以在假设分布为(X,Y)是中心对称的:也就是说,当它同时否定两者时它是不变的XY. 这包括所有双变量法线(均值(0,0), 当然)。

关键思想是,对于任何z0, 事件Z2z2是事件的区别XzYzXzYz. (第一个是最小值不小于z,而第二个将排除最小值超过z.) 这些事件又可以细分如下:

Pr(Z2z2)=Pr(Xz)Pr(Yz)+Pr(X,Y<z)Pr(X,Y>z).

中心对称假设确保最后两个概率相消。 前两个概率由标准正态 CDF 给出Φ, 产生

Pr(Z2z2)=12Φ(z).

那个展品Z作为半正态分布,因此它的平方将具有与标准正态的平方相同的分布,根据定义,它是χ2(1)分配。


这个演示可以倒过来显示Z2有个χ2(1)当且仅当分布Pr(X,Yz)=Pr(X,Yz)对所有人z0.


这是R产生这些数字的代码。

library(copula)

n <- 1e4
set.seed(17)
xy <- qnorm(rCopula(n, claytonCopula(1)))
colnames(xy) <- c("X", "Y")
z2 <- pmin(xy[,1], xy[,2])^2

cutpoints <- c(0:10, Inf)
z2.obs <- table(cut(z2, cutpoints))
z2.exp <- diff(pgamma(cutpoints, 1/2, 1/2))
rbind(Observed=z2.obs, Expected=z2.exp * length(z2))
chisq.test(z2.obs, p=z2.exp)

par(mfrow=c(2,2))
qqnorm(xy[,1], ylab="X"); abline(c(0,1), col="Red", lwd=2)
qqnorm(xy[,2], ylab="Y"); abline(c(0,1), col="Red", lwd=2)

plot(xy, pch=19, cex=0.75, col="#00000003", main="Data")

qqplot(qgamma(seq(0, 1, length.out=length(z)), 1/2, 1/2), z2,
       xlab="Theoretical Quantiles", ylab="Z2",
       main="Gamma(1/2,1/2) Q-Q Plot")
abline(c(0,1), col="Red", lwd=2)

M=min(X,Y)2,

P(M<m)=P(M<m,X<Y)+P(M<m,X>Y)           =P(M<m|X<Y)P(X<Y)+P(M<m|X>Y)P(X>Y)=P(X2<m)P(X<Y)+P(Y2<m)P(X>Y)                      =12P(X2<m)+12P(Y2<m) =P(X2<m)