我可以找到 X 大于 x 的概率的 MLE

机器算法验证 可能性 最大似然
2022-03-25 05:44:05

例如 ~P(X>12)XiN(μ,σ2)

1个回答

我确定您知道(或可以轻松推导出),的最大似然估计量是(μ,σ2)

(μ^,σ^2)=(X¯,Var(X))

其中,像往常一样,并且有点不寻常的是,nX¯=X1+X2++Xn

Var(X)=1n((X1X¯)2+(X2X¯)2++(XnX¯)2)

(注意分母中的而不是)。nn1

MLE 的一个基本特性是参数的任何函数的最大似然估计量等于应用于参数的 MLE 的ff 在这种情况下,让成为标准的 Normal CDFΦ

f(μ,σ2)=Pr(X>12)=1Φ(12μσ2).

的 MLEPr(X>12)

f^=1Φ(12μ^σ^2).

因为最大似然估计是针对相对较大样本量的程序,所以这里是基于 100,000 个样本量 参数设置为n=240.(μ,σ)=(5,3).

数字

您可以看到估计值如何大致均匀地分布在真实值周围(标记为红色垂直线段),表明此解决方案是一个合理的估计量。更大样本量的进一步模拟(我达到了,但将模拟限制为仅一千次迭代以将计算时间降低到一两秒)表明该解决方案收敛于真实值,因为它应该。n=24000

#
# Specify the problem.
#
mu <- 5
sigma <- 3
threshold <- 12
n <- 240
#
# Draw samples.
#
set.seed(17)
n.sim <- 1e5
x <- matrix(rnorm(n.sim*n, mu, sigma), n.sim)
#
# Compute the MLEs.
#
mu.hat <- rowMeans(x)
sigma2.hat <- rowMeans((x - mu.hat)^2)
p.hat <- pnorm((threshold - mu.hat) / sqrt(sigma2.hat), lower.tail = FALSE)
#
# Plot the MLEs.
#
hist(p.hat, freq=FALSE, col="#f0f0f0", breaks=50,
     xlab=expression(hat(f)), cex.lab=1.25,
     main=expression(paste("Histogram of ", Pr(X>12))))
abline(v = pnorm(threshold, mu, sigma, lower.tail = FALSE), lwd=2, col="#d01010")