封闭式函数相关μμ对数级数分布的自然参数?

机器算法验证 广义线性模型 指数族 链接功能 对数级数分布
2022-03-29 16:37:41

在这里回答另一个问题时,我提到了对数系列分布作为每个属物种的可能模型。

在回答过程中查看 pmf 时,我意识到它是指数族(我以前没有意识到这一事实)。

维基百科页面上 pmf 的参数化(直到符号更改是我见过的唯一形式)是形式

f(y)=c(p).py/y,0<p<1;y=1,2,3,...

在哪里c(p)=1log(11p)=1log(1p)是归一化常数。

在此处输入图像描述

通过以指数族的“标准形式”检查它,我们看到了自然参数,θ=log(p)(还有足够的统计数据T(x)=x, 所以 MLE 为常数p应该是样本均值的函数,在这种情况下,我们希望 MLE 应该等效于矩量法,事实证明确实如此)。

[所以看起来如果我们有一个模特的 glmθ=logp=Xβ, 然后Xy应该足够β.]

很容易推导出来μ作为一个函数p(这个系列是微不足道的),或者(从指数族的角度来看)b(θ), 无论哪种方式写μ按照θ

μ=c(p)p1p=1log(1eθ)eθ1eθ.

计算方差函数甚至是相当可行的V(μ).

但是,我并不清楚如何反转这个平均函数来编写θ(或等效地,p) 作为μ(这很方便,因为它是链接功能)。这可能是累了,或者实际上可能很困难,但我看不出如何去任何地方......所以问题是:

θ(μ)写成封闭形式?

(p(μ)也可以)

我不想对封闭形式中包含的内容过于迂腐。能够根据具有已知属性的众所周知的函数来编写这些东西是很有用的,通过调用某些函数可以相对容易地评估这些函数。包中通常可用的或多或少的“标准”函数的表达式,比如 Gamma 函数,甚至说 Lambert-W 函数(甚至我猜的各种形式的超几何函数)都可以计算——我更多对我们可以说的有用的事情感兴趣θ(μ)以及我们评估它的难易程度(除了采用上述等式的明显步骤μ-作为-的功能-θ并且只是解决θ如所须)。

1个回答

您的问题有答案:Lambert-W。

在 R 中,您可以使用

# Load library
  library(LambertW)

# Define function to obtain p from mu
  p <- function(mu) {1 - exp((1/mu) + W(-1/(mu*exp(1/mu)),-1))}

# Show (visually) that the function provides the correct values
  mu <- 1 + 10*c(0:100)/100
  plot(p(mu), mu, xlab="p", ylab="mu", las=1)
  pp <- c(1:99)/100
  lines(pp, -pp/((1-pp)*log(1-pp)))

获得

R 兰伯特 W

在 Mathematica 中,您可以使用

data = Table[{1 - Exp[(1/mu) + 
       ProductLog[-1, -1/(mu Exp[1/mu])]], mu}, {mu, 1.01, 5, 0.01}];
cp = -1/Log[1 - p];
ListPlot[{data, Table[{p, cp p/(1 - p)}, {p, 0.1, 0.93, 0.01}]}, 
 PlotStyle -> {{PointSize[0.03]}, {PointSize[0.01]}}]  

(Mathematica 用于确定确定关系的一般形式pμ.)