机器算法验证 - 寻求对 Firth Logistic 回归的理论理解 - 吾爱随笔录

寻求对 Firth Logistic 回归的理论理解

机器算法验证物流最大似然分离

2022-02-11 04:59:24

我正在尝试理解 Firth 逻辑回归（在逻辑回归中处理完美/完全或准完全分离的方法），以便我可以用简化的术语向其他人解释它。有人对 Firth 估计对 MLE 所做的修改有一个简单的解释吗？

我已经尽我所能阅读了 Firth (1993)，并且我知道对分数函数进行了更正。我对校正的起源和理由以及评分函数在 MLE 中扮演的角色很模糊。

对不起，如果这是基本知识。我所回顾的文献似乎需要对 MLE 的理解比我所拥有的要深入得多。

1个回答

Firth 的修正相当于指定 Jeffrey 的先验并寻求后验分布的模式。粗略地说，假设回归参数的真实值等于零，它会向数据集添加一半的观察值。

Firth 的论文是高阶渐近的一个例子。可以说，空序是由大数定律提供的：在大样本中，其中是真实值。您可能已经了解到 MLE 是渐近正态的，大致是因为它们基于 iid 变量（分数）总和的非线性变换。这是一阶近似：其中是具有零均值和方差（或 var-cov 矩阵）的正态变量，它是单个观察的 Fisher 信息的倒数。然后似然比检验统计量是渐近的 $\hat \theta_n \approx \theta_0$ $\theta_0$ $\theta_n = \theta_0 + O(n^{-1/2}) = \theta_0 + v_1 n^{-1/2} + o(n^{-1/2})$ $v_1$ $\sigma_1^2$ $n(\hat\theta_n - \theta_0)^2/\sigma_1^2 \sim \chi^2_1$ 或内积和逆协方差矩阵的多元扩展。

高阶渐近学试图了解下一项，通常通过梳理下一项。这样，估计和测试统计数据可以包含量级的小样本偏差（如果你看到论文说“我们有无偏的 MLE”，这些人可能不知道他们在说什么）。这种最著名的校正是 Bartlett 对似然比检验的校正。Firth 的修正也是这样的：它将固定量（第 30 页顶部）添加到似然性中，并且在大样本中，该量的相对贡献以速率消失的与样本信息相比相形见绌。 $o(n^{-1/2})$ $O(n^{-1})$ $1/n$ $\frac12 \ln \det I(\theta)$ $1/n$

其它你可能感兴趣的问题

上一篇如何解释 PCA 载荷？下一篇在地图上显示空间和时间相关性