机器算法验证 - 混合密度的偏度 - 吾爱随笔录

我正在将高斯混合拟合到财务数据。我的混合密度由下式给出：

$f(l)=πϕ(l;μ_1,σ^2_1)+(1−π)ϕ(l;μ_2,σ_2^2)$

我已经计算了数据的偏度。现在，我想看看拟合的高斯混合的偏度。由于我使用了 ML（EM 算法）而不是矩量法，所以矩量将不一样。我知道这个。但是我不知道如何计算混合高斯的偏度？我想要一个理论推导公式，所以我的意思是，我不想通过取拟合值来计算这个经验值并在 R 中执行例如 skew(...) 。我会这样做来控制自己，但首先我想得到它的理论公式。我找不到它（我用谷歌搜索了偏度混合密度等。）

我知道偏度是由

$\gamma_1 = \operatorname{E}\Big[\big(\tfrac{X-\mu}{\sigma}\big)^{\!3}\, \Big] = \frac{\mu_3}{\sigma^3} = \frac{\operatorname{E}\big[(X-\mu)^3\big]}{\ \ \ ( \operatorname{E}\big[ (X-\mu)^2 \big] )^{3/2}}$

那么什么是混合高斯的偏度？我怎样才能得出它？数学推导会很棒。我已经估计了两个密度，并且我有 μ 和 σ 的估计值。我想要一个公式，我可以插入这些值来获得混合密度的偏度。然后我将在 R 中使用 skew(...) 凭经验控制它。

我知道这是因为峰态：我想用它来表示偏度，并且 - 这会很棒 - 它的推导？

# Sampling from a 2-gaussian mixture gaussmix <- function(n,m1,m2,s1,s2,alpha) { I <- runif(n)<alpha rnorm(n,mean=ifelse(I,m1,m2),sd=ifelse(I,s1,s2)) } # A simulated sample samp <- gaussmix(100000,0,0,1,1,0.5) library(moments) # Approximated kurtosis and skeweness using the simulated sample skewness(samp) kurtosis(samp)