总和不正常的两个 *correlated* 正态变量的示例

机器算法验证 相关性 正态分布 多元分析 双变量
2022-03-11 15:03:42

我知道一些很好的相关随机变量对的例子,它们是边缘正常但不是共同正常的。请参阅Dilip Sarwate的这个答案以及Cardinal的这个答案

我也知道两个正常随机变量的总和不正常的例子。请参阅Macro这个答案但是在这个例子中,两个随机变量是不相关的。

是否有两个具有非零协方差且总和不正常的正态随机变量的示例?或者是否有可能证明任何两个相关正态随机变量的总和,即使它们不是二元正态,也一定是正态的?

[上下文:我有一个作业问题,要求的分布,其中的标准法线我认为这个问题旨在说明它们是二元正态的。但是我想知道如果没有对非零的额外假设,是否可以说任何话。]aX+bYXYρρ

谢谢!

2个回答

几乎任何双变量 copula 都会产生一对具有一些非零相关性的正态随机变量(有些会给出零,但它们是特殊情况)。他们中的大多数(几乎所有)都会产生非正常的总和。

在某些 copula 族中,可以产生任何所需的(总体) Spearman相关;困难仅在于找到正常边距的 Pearson 相关性;原则上是可行的,但一般来说代数可能相当复杂。[但是,如果您有总体 Spearman 相关性,则 Pearson 相关性 - 至少对于像高斯这样的轻尾边距 - 在许多情况下可能不会离它太远。]

除了红衣主教情节中的前两个例子外,所有例子都应该给出非正态总和。


一些例子——前两个与红衣主教的例子二元分布的第五个来自同一个系词家族,第三个是退化的。

示例 1:

克莱顿 copula ( )θ=0.7

正态边距直方图、非正态总和和双变量分布图

在这里,总和非常明显地达到峰值并且相当强烈的右偏

 

示例 2:

克莱顿系词 ( )θ=2

正态边距直方图、非正态总和和双变量分布图

这里的总和有轻微的左偏。以防万一这对每个人来说都不是很明显,在这里我翻转了分布(即,我们有一个淡紫色(x+y)

x+y 和 -(x+y) 的叠加直方图

 

我们可以很容易地互换总和的偏斜方向,使负相关与左偏斜相关,而与右偏斜正相关(例如,通过在每个上述情况 - 新变量的相关性将与以前相同,但总和的分布将翻转为 0,扭转偏度)。X=XY=Y

另一方面,如果我们只是否定其中一个,我们将改变偏度强度与相关符号之间的关联(但不是它的方向)。

还值得尝试一些不同的 copula,以了解二元分布和正态边距会发生什么。

可以对带有 t-copula 的高斯边距进行实验,而不必过多担心 copula 的细节(从相关二元 t 生成,这很容易,然后通过概率积分变换转换为均匀边距,然后通过逆正常 cdf)。它将有一个非正态但对称的和。所以即使你没有很好的 copula-packages,你仍然可以相当容易地做一些事情(例如,如果我试图在 Excel 中快速显示一个示例,我可能会从 t-copula 开始)。

--

示例 3:(这更像是我最初应该开始的)

考虑一个基于标准统一的 copula ,让对于对于结果对于具有均匀的边距,但二元分布是退化的。将两个边距转换为正常,我们得到的分布,如下所示:UV=U0U<12V=32U12U1UVX=Φ1(U),Y=Φ1(V)X+Y

在此处输入图像描述

在这种情况下,它们之间的相关性约为 0.66。

同样,是具有(在这种情况下,明显地)非正态总和的相关正态 - 因为它们不是双变量正态。XY

[人们可以通过翻转的中心(在对于),以获得这些将在 0 处有一个尖峰,然后在其两侧有一个间隙,带有正常的尾巴。]U(12c,12+c)c[0,12]V


一些代码:

library("copula")
par(mfrow=c(2,2))

# Example 1
U <- rCopula(100000, claytonCopula(-.7))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
       col=rgb(0,100,0,70,maxColorValue=255),
       main="Bivariate distribution")
text(-3,-1.2,"cor = -0.68")
text(-2.5,-2.8,expression(paste("Clayton: ",theta," = -0.7")))

第二个例子:

#--
# Example 2:
U <- rCopula(100000, claytonCopula(2))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
    col=rgb(0,100,0,70,maxColorValue=255),
    main="Bivariate distribution")
text(3,-2.5,"cor = 0.68")
text(2.5,-3.6,expression(paste("Clayton: ",theta," = 2")))
#
par(mfrow=c(1,1))

第三个例子的代码:

#--
# Example 3:
u <- runif(10000)
v <- ifelse(u<.5,u,1.5-u)
x <- qnorm(u)
y <- qnorm(v)
hist(x+y,n=100)

我想出了一个例子。X是标准正态变量,Y=-X。那么X+Y=0,就是常数。谁能确认这是一个反例?

我们知道如果 X,Y 是共同正态的,那么它们的总和也是正态的。但是如果它们的相关性是-1呢?

我对此有点困惑。谢谢。