任何依赖于极值的(大致)自变量的例子?

机器算法验证 相关性 极值
2022-03-13 17:19:28

我正在寻找 2 个随机变量这样的示例XY

|cor(X,Y)|0

但是当考虑分布的尾部时,它们是高度相关的。(我尽量避免尾部的“相关”/“相关”,因为它可能不是线性的)。

大概用这个:

|cor(X,Y)|0

其中XX>90%X人口为条件,并且Y在相同的意义上定义。

1个回答

这是一个示例,其中甚至具有正常的边际。XY

让:

XN(0,1)

为条件,让如果,否则,对于一些常数XY=X|X|>ϕY=Xϕ

你可以证明,独立于,我们有:ϕ

YN(0,1)

有一个值使得如果那么ϕcor(X,Y)=0ϕ=1.54cor(X,Y)0

但是,不是独立的,两者的极值完全相关。请参见下面的 R 中的模拟以及随后的图表。XY

Nsim <- 10000
set.seed(123)

x <- rnorm(Nsim)
y <- ifelse(abs(x)>1.54,x,-x)

print(cor(x,y)) # 0.00284 \approx 0

plot(x,y)

extreme.x <- which(abs(x)>qnorm(0.95))
extreme.y <- which(abs(y)>qnorm(0.95))
extreme.both <- intersect(extreme.x,extreme.y)

print(cor(x[extreme.both],y[extreme.both])) # Exactly 1

在此处输入图像描述