使用哪个 R 包来计算混合模型的组件参数

机器算法验证 r 混合模式
2022-03-26 08:48:05

我想将混合模型拟合到 Monte Carlo 生成的具有概率密度的数据,这些数据通常看起来像所附图像中的那些。 典型密度

从目视检查看来,正常的混合模型可能适用,但在检查 CRAN 任务视图时,我真的不知道哪个包可能适合我的需要。

基本上我想做的是提供一个数据向量,然后让包函数返回混合模型中每个组件的均值、方差和比例权重,还可能确定模型中有多少组件。

2个回答

尝试 混合

这是一个例子:

library(mixdist)  

#Build data vector "x" as a mixture of data from 3 Normal Distributions  
x1 <- rnorm(1000, mean=0, sd=2.0)  
x2 <- rnorm(500, mean=9, sd=1.5)  
x3 <- rnorm(300, mean=13, sd=1.0)  
x <- c(x1, x2, x3)  

#Plot a histogram (you'll play around with the value for "breaks" as    
#you zero-in on the fit).   Then build a data frame that has the  
#bucket midpoints and counts.  
breaks <- 30  
his <- hist(x, breaks=breaks)  
df <- data.frame(mid=his$mids, cou=his$counts)  
head(df)  

#The above Histogram shows 3 peaks that might be represented by 3 Normal  
#Distributions.  Guess at the 3 Means in Ascending Order, with a guess for  
#the associated 3 Sigmas and fit the distribution.  
guemea <- c(3, 11, 14)  
guesig <- c(1, 1, 1)  
guedis <- "norm"  
(fitpro <- mix(as.mixdata(df), mixparam(mu=guemea, sigma=guesig), dist=guedis))  

#Plot the results  
plot(fitpro, main="Fit a Probability Distribution")  
grid()  
legend("topright", lty=1, lwd=c(1, 1, 2), c("Original Distribution to be Fit", "Individual Fitted Distributions", "Fitted Distributions Combined"), col=c("blue", "red", rgb(0.2, 0.7, 0.2)), bg="white")  


===========================  


Parameters:  
      pi     mu  sigma  
1 0.5533 -0.565 1.9671  
2 0.2907  8.570 1.6169  
3 0.1561 12.725 0.9987  

Distribution:  
[1] "norm"  

Constraints:  
   conpi    conmu consigma   
  "NONE"   "NONE"   "NONE"   

在此处输入图像描述

Mclust很好。mclust函数适合数据的正态分布混合您可以根据 BIC ( mclustmodel ) 自动选择组件数量或指定组件数量。也无需将您的数据转换为数据框。

此外,包Mixtools和函数normalmixEM适合法线的混合。

更新:我最近发现了 mixAK 包和 NMixMCMC 功能,非常棒。它有很多选项,包括用于组件选择的 RJMCMC、左右审查等...