Yudi Pawitan 在他的书In All Likelihood中写道,在最大似然估计 (MLE) 处评估的对数似然的二阶导数是观察到的 Fisher 信息(另请参见本文档,第 1 页)。这正是大多数优化算法所喜欢optim
的R
回报:在 MLE 上评估的 Hessian。当负对数似然最小化,则返回负 Hessian。正如您正确指出的那样,MLE 的估计标准误差是观察到的 Fisher 信息矩阵的逆对角元素的平方根。换句话说: Hessian 的逆(或负 Hessian)的对角元素的平方根是估计的标准误差。
概括
- 在 MLE 评估的负 Hessian 与在 MLE 评估的观察到的 Fisher 信息矩阵相同。
- 关于您的主要问题:不,通过反转(负)Hessian 可以找到观察到的 Fisher 信息是不正确的。
- 关于你的第二个问题:(负)Hessian 的逆是渐近协方差矩阵的估计量。因此,协方差矩阵的对角元素的平方根是标准误差的估计量。
- 我认为您链接到的第二个文档弄错了。
正式地
让l(θ)是一个对数似然函数。Fisher信息矩阵 I(θ)是对称的(p×p)包含条目的矩阵:
I(θ)=−∂2∂θi∂θjl(θ), 1≤i,j≤p
观察到
的Fisher 信息矩阵很简单I(θ^ML),以最大似然估计 (MLE) 评估的信息矩阵。Hessian 定义为:
H(θ)=∂2∂θi∂θjl(θ), 1≤i,j≤p
它只是似然函数关于参数的二阶导数矩阵。因此,如果您最小化负对数似然,则返回的 Hessian 等效于观察到的 Fisher 信息矩阵,而在最大化对数似然的情况下,负Hessian 是观察到的信息矩阵。
此外,Fisher 信息矩阵的逆矩阵是渐近协方差矩阵的估计量:
Var(θ^ML)=[I(θ^ML)]−1
标准误差是协方差矩阵的对角元素的平方根。对于最大似然估计的渐近分布,我们可以写
θ^ML∼aN(θ0,[I(θ^ML)]−1)
在哪里θ0表示真正的参数值。因此,最大似然估计的估计标准误差由下式给出:
SE(θ^ML)=1I(θ^ML)−−−−−−√