总和不正常的两个 *correlated* 正态变量的示例
几乎任何双变量 copula 都会产生一对具有一些非零相关性的正态随机变量(有些会给出零,但它们是特殊情况)。他们中的大多数(几乎所有)都会产生非正常的总和。
在某些 copula 族中,可以产生任何所需的(总体) Spearman相关;困难仅在于找到正常边距的 Pearson 相关性;原则上是可行的,但一般来说代数可能相当复杂。[但是,如果您有总体 Spearman 相关性,则 Pearson 相关性 - 至少对于像高斯这样的轻尾边距 - 在许多情况下可能不会离它太远。]
除了红衣主教情节中的前两个例子外,所有例子都应该给出非正态总和。
一些例子——前两个与红衣主教的例子二元分布的第五个来自同一个系词家族,第三个是退化的。
示例 1:
克莱顿 copula ( )
在这里,总和非常明显地达到峰值并且相当强烈的右偏
示例 2:
克莱顿系词 ( )
这里的总和有轻微的左偏。以防万一这对每个人来说都不是很明显,在这里我翻转了分布(即,我们有一个淡紫色
我们可以很容易地互换总和的偏斜方向,使负相关与左偏斜相关,而与右偏斜正相关(例如,通过在每个和上述情况 - 新变量的相关性将与以前相同,但总和的分布将翻转为 0,扭转偏度)。
另一方面,如果我们只是否定其中一个,我们将改变偏度强度与相关符号之间的关联(但不是它的方向)。
还值得尝试一些不同的 copula,以了解二元分布和正态边距会发生什么。
可以对带有 t-copula 的高斯边距进行实验,而不必过多担心 copula 的细节(从相关二元 t 生成,这很容易,然后通过概率积分变换转换为均匀边距,然后通过逆正常 cdf)。它将有一个非正态但对称的和。所以即使你没有很好的 copula-packages,你仍然可以相当容易地做一些事情(例如,如果我试图在 Excel 中快速显示一个示例,我可能会从 t-copula 开始)。
--
示例 3:(这更像是我最初应该开始的)
考虑一个基于标准统一的 copula ,让对于和对于。结果对于和具有均匀的边距,但二元分布是退化的。将两个边距转换为正常,我们得到的分布,如下所示:
在这种情况下,它们之间的相关性约为 0.66。
同样,和是具有(在这种情况下,明显地)非正态总和的相关正态 - 因为它们不是双变量正态。
[人们可以通过翻转的中心(在,对于),以获得。这些将在 0 处有一个尖峰,然后在其两侧有一个间隙,带有正常的尾巴。]
一些代码:
library("copula")
par(mfrow=c(2,2))
# Example 1
U <- rCopula(100000, claytonCopula(-.7))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
col=rgb(0,100,0,70,maxColorValue=255),
main="Bivariate distribution")
text(-3,-1.2,"cor = -0.68")
text(-2.5,-2.8,expression(paste("Clayton: ",theta," = -0.7")))
第二个例子:
#--
# Example 2:
U <- rCopula(100000, claytonCopula(2))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
col=rgb(0,100,0,70,maxColorValue=255),
main="Bivariate distribution")
text(3,-2.5,"cor = 0.68")
text(2.5,-3.6,expression(paste("Clayton: ",theta," = 2")))
#
par(mfrow=c(1,1))
第三个例子的代码:
#--
# Example 3:
u <- runif(10000)
v <- ifelse(u<.5,u,1.5-u)
x <- qnorm(u)
y <- qnorm(v)
hist(x+y,n=100)
我想出了一个例子。X是标准正态变量,Y=-X。那么X+Y=0,就是常数。谁能确认这是一个反例?
我们知道如果 X,Y 是共同正态的,那么它们的总和也是正态的。但是如果它们的相关性是-1呢?
我对此有点困惑。谢谢。