Heathcote, Brown & Mewhort (2002, PDF ) 提出分位数最大概率估计(最初称为分位数最大似然估计,但后来更正)作为拟合分布数据的方法,并发现它至少优于更传统的连续最大似然估计方法在将数据拟合到前高斯分布的情况下(尽管另见本文,这表明这种好处也适用于其他分布)。
我试图了解实现 QMPE 的实际步骤。我知道首先指定增加和等距的分位数概率,然后使用这些来获得q与这些概率相对应的观察数据中的分位数值( )。我也明白,这些观察到的分位数值随后用于计算每个分位数 ( N) 之间的观察次数。但这就是我卡住的地方。假设一个人搜索任何一个假设生成数据的先验模型的参数空间,搜索一个参数集,该参数集使 和 的联合概率q最大化N。但是,我不知道如何在给定一组候选参数的情况下计算这个联合概率。
没有强大的数学背景,我认为代码要好得多,所以如果有人能帮助我弄清楚接下来会发生什么,我将不胜感激。这是尝试将一些数据拟合到前高斯的尝试的开始:
#generate some data to fit
true_mu = 300
true_sigma = 50
true_tau = 100
my_data = rnorm(100, true_mu,
true_sigma) + rexp(100, 1/true_tau)
#select some quantile probabilities;
#estimate quantiles and inter-quantile
#counts
#from the observed data
quantile_probs = seq(.1, .9, .1)
#or does it have to be seq(0,1,.1) ?
q = quantile( my_data, probs =
quantile_probs, type = 5 ) #Heathcote et al
#apparently use type=5 given their example
N = rep( NA , length(q)-1 )
for( i in 1:( length(q)-1 ) ){
N = length( my_data[ (my_data>q[i])
& (my_data<=q[i+1]) ] )
}
#specify some candidate parameter values
#to assess (normally done as part of an
#iterative search using an optimizer like
#optim)
candidate_mu = 350
candidate_sigma = 25
candidate_tau = 30
#given these candidates, what next?