多元正态分布的高阶泛化

机器算法验证 分布 正态分布 多元分析
2022-03-13 15:00:53

从某种意义上说,多元正态分布是我们可以仅使用向量(第一阶张量)和对称正定矩阵(第二阶张量)来描述的“最佳”分布。

N(μi,Σij)=|2πΣ|12e(xμ)TΣ1(xμ)

是否有对高阶张量的概括?即,是否存在由向量、对称矩阵和对称三阶张量描述的“最佳”分布?M(μi,Σij,Πijk)?

1个回答

我认为您的问题没有积极的答案。正态分布(单变量或多变量)的美妙之处在于,它很容易通过高于 2 的阶数累积量为零来定义。(秩序的累积量k是标准化的k-特征函数的三阶导数:κk=ikktkϕ(t)|t=0.) CLT 基本上指出,对于所有人k,κk=o(1)作为n(并且可以确定费率)。

然而,零累积量的性质非常脆弱。一旦你离开零三次累积量,所有高阶累积量也必须是非零的:没有分布κ4=0如果κ30. 因此,对于每个偏度值(显然反映在第三个累积量中),其他累积量都有一系列合理的值,并且分布的美丽将在旁观者的眼中。

在某种程度上,多元正态分布的“最接近”是偏态正态分布它的密度是由普通 cdf “过滤”的普通密度:f(x;Σ,α)=2f(x;μ,Σ)Φ(αx)在哪里f(x;Σ)是具有均值零向量和协方差矩阵的多元法线的密度Σ, 和Φ(z)是标准的正常 cdf。所以你在这里并没有真正的张量,而只有一个倾斜向量。很好,因为α=0,你得到多元正态分布的特例。

解决这个问题的另一种方法是从稳定法律的角度来看。一个稳定的规律是这样一种分布,使得具有这种分布的随机变量的线性变换再次具有这种分布,可能是按比例缩放和移动的。正态分布就是一个明显的例子。柯西是另一个例子,尽管远没有那么明显。稳定定律由其特征函数隐含定义:ϕ(t)=exp[itμ|ct|α(1iβsign(t)Φ]. 这里,μ是移位参数,c是尺度参数,α是稳定性参数,β是不对称参数,并且Φ=tan(πα/2)为了α1, 和Φ=2/πln|t|为了α=1. (α=2,β=0给出正态分布;α=1,β=0给出柯西分布;第一个之后的时刻只存在于α=2.)维基百科提供了一堆图片。稳定定律的多元扩展也确实存在(感谢@mpiktas 指出它们!)。