寻求对 Firth Logistic 回归的理论理解

机器算法验证 物流 最大似然 分离
2022-02-11 04:59:24

我正在尝试理解 Firth 逻辑回归(在逻辑回归中处理完美/完全或准完全分离的方法),以便我可以用简化的术语向其他人解释它。有人对 Firth 估计对 MLE 所做的修改有一个简单的解释吗?

我已经尽我所能阅读了 Firth (1993),并且我知道对分数函数进行了更正。我对校正的起源和理由以及评分函数在 MLE 中扮演的角色很模糊。

对不起,如果这是基本知识。我所回顾的文献似乎需要对 MLE 的理解比我所拥有的要深入得多。

1个回答

Firth 的修正相当于指定 Jeffrey 的先验并寻求后验分布的模式。粗略地说,假设回归参数的真实值等于零,它会向数据集添加一半的观察值。

Firth 的论文是高阶渐近的一个例子。可以说,空序是由大数定律提供的:在大样本中,其中是真实值。您可能已经了解到 MLE 是渐近正态的,大致是因为它们基于 iid 变量(分数)总和的非线性变换。这是一阶近似:其中是具有零均值和方差(或 var-cov 矩阵)的正态变量,它是单个观察的 Fisher 信息的倒数。然后似然比检验统计量是渐近的θ^nθ0θ0θn=θ0+O(n1/2)=θ0+v1n1/2+o(n1/2)v1σ12n(θ^nθ0)2/σ12χ12或内积和逆协方差矩阵的多元扩展。

高阶渐近学试图了解下一项,通常通过梳理下一项这样,估计和测试统计数据可以包含量级的小样本偏差(如果你看到论文说“我们有无偏的 MLE”,这些人可能不知道他们在说什么)。这种最著名的校正是 Bartlett 对似然比检验的校正。Firth 的修正也是这样的:它将固定量(第 30 页顶部)添加到似然性中,并且在大样本中,该量的相对贡献以速率消失的与样本信息相比相形见绌。o(n1/2)O(n1)1/n12lndetI(θ)1/n