多项式的渐近分布

机器算法验证 渐近的 多项分布
2022-03-20 22:27:32

我正在寻找多项分布对 d 结果的限制分布。IE,配置如下

limnn12Xn

其中Xn是一个向量值随机变量,密度为fn(x)对于x使得ixi=n , xiZ,xi0和0 对于所有其他x,其中

fn(x)=n!i=1dpixixi!

我在 Larry Wasserman 的“所有统计数据”定理 14.6,第 237 页中找到了一种形式,但是为了限制分布,它为 Normal 提供了一个奇异的协方差矩阵,所以我不确定如何对其进行归一化。您可以将随机向量投影到 (d-1) 维空间中以使协方差矩阵满秩,但是要使用什么投影呢?

更新 11/5

Ray Koopman 对奇异高斯问题有一个很好的总结基本上,奇异协方差矩阵表示变量之间的完美相关性,这是不可能用高斯表示的。但是,可以得到条件密度的高斯分布,其条件是随机向量的值是有效的(在上述情况下,分量加起来为n

条件高斯的不同之处在于,逆被替换为伪逆,并且归一化因子使用“非零特征值的乘积”而不是“所有特征值的乘积”。Ian Frisce 给出了一些细节的链接。

还有一种方法可以不参考特征值来表达条件高斯的归一化因子, 这里是一个推导

4个回答

协方差仍然是非负定的(有效的多元正态分布也是如此),但不是正定的:这意味着(至少)随机向量的一个元素是其他元素的线性组合。

因此,来自该分布的任何绘制都将始终位于的子空间中。因此,这意味着不可能定义密度函数(因为分布集中在子空间上:想想如果方差为零,单变量正态将集中在均值上的方式)。Rd

但是,正如 Robby McKilliam 所建议的,在这种情况下,您可以删除随机向量的最后一个元素。这个简化向量的协方差矩阵将是原始矩阵,最后一列和最后一行被删除,现在将是正定的,并且会有一个密度(这个技巧在其他情况下也可以工作,但你必须小心哪个元素你掉了,你可能需要掉不止一个)。

这里的奇异协方差没有固有的问题。您的渐近分布是奇异正态分布。请参阅http://fedc.wiwi.hu-berlin.de/xplore/tutorials/mvahtmlnode34.html,它给出了奇异法线的密度。

在我看来,Wasserman 的协方差矩阵是奇异的,可以将其乘以个向量,即长度d[1,1,1,,1]d

无论如何,维基百科给出了相同的协方差矩阵。如果我们将自己限制为二项式分布,那么标准中心极限定理告诉我们,二项式分布(在适当缩放后)随着变大而收敛到正态(再次参见维基百科)。应用类似的想法,您应该能够证明适当缩放的多项式将在分布中收敛到多元正态分布,即每个边际分布只是一个二项式并收敛到正态分布,并且它们之间的方差是已知的。n

所以,我非常有信心你会发现 的分布 收敛到零均值和协方差 的多元正态分布, 其中是协方差所讨论的多项式矩阵和是概率向量

Xnnpn
Cn
Cp[p1,,pd]

不是这样吗?对于所有其中的多项协方差矩阵?既然是这种情况,我不明白您所说的“选择自由”是什么意思,因为任何“选择”都是等价的。|Si|=|Sj|i,jSii