我正在尝试理解 Firth 逻辑回归(在逻辑回归中处理完美/完全或准完全分离的方法),以便我可以用简化的术语向其他人解释它。有人对 Firth 估计对 MLE 所做的修改有一个简单的解释吗?
我已经尽我所能阅读了 Firth (1993),并且我知道对分数函数进行了更正。我对校正的起源和理由以及评分函数在 MLE 中扮演的角色很模糊。
对不起,如果这是基本知识。我所回顾的文献似乎需要对 MLE 的理解比我所拥有的要深入得多。
我正在尝试理解 Firth 逻辑回归(在逻辑回归中处理完美/完全或准完全分离的方法),以便我可以用简化的术语向其他人解释它。有人对 Firth 估计对 MLE 所做的修改有一个简单的解释吗?
我已经尽我所能阅读了 Firth (1993),并且我知道对分数函数进行了更正。我对校正的起源和理由以及评分函数在 MLE 中扮演的角色很模糊。
对不起,如果这是基本知识。我所回顾的文献似乎需要对 MLE 的理解比我所拥有的要深入得多。
Firth 的修正相当于指定 Jeffrey 的先验并寻求后验分布的模式。粗略地说,假设回归参数的真实值等于零,它会向数据集添加一半的观察值。
Firth 的论文是高阶渐近的一个例子。可以说,空序是由大数定律提供的:在大样本中,其中是真实值。您可能已经了解到 MLE 是渐近正态的,大致是因为它们基于 iid 变量(分数)总和的非线性变换。这是一阶近似:其中是具有零均值和方差(或 var-cov 矩阵)的正态变量,它是单个观察的 Fisher 信息的倒数。然后似然比检验统计量是渐近的或内积和逆协方差矩阵的多元扩展。
高阶渐近学试图了解下一项,通常通过梳理下一项。这样,估计和测试统计数据可以包含量级的小样本偏差(如果你看到论文说“我们有无偏的 MLE”,这些人可能不知道他们在说什么)。这种最著名的校正是 Bartlett 对似然比检验的校正。Firth 的修正也是这样的:它将固定量(第 30 页顶部)添加到似然性中,并且在大样本中,该量的相对贡献以速率消失的与样本信息相比相形见绌。