解释对数似然

机器算法验证 r 解释 可能性
2022-03-09 11:04:06

我很难解释一些结果。我正在做一个与层次相关的回归ecoreg如果我输入代码,我会收到包含优势比、置信比和 2 倍最大化对数似然的输出。

但是,我不完全理解如何解释 2x 最大化对数似然。据我所知,对数似然是一种计算似然的便捷方法,它根据结果计算参数的值。但我不明白更高或更低的值是否更好。我查看了几个在线资源,例如https://stackoverflow.com/questions/2343093/what-is-log-likelihood,但我仍然卡住了。

在我收到的结果下方:

Call:
eco(formula = cbind(y, N) ~ deprivation + meanIncome, binary = ~fracSmoke + 
    soclass, data = dfAggPlus, cross = cross)

Aggregate-level odds ratios: 
                   OR        l95        u95
(Intercept) 0.0510475 0.03837276 0.06790878
deprivation 0.9859936 0.88421991 1.09948134
meanIncome  1.0689951 0.95574925 1.19565924

Individual-level odds ratios:
                OR       l95      u95
fracSmoke 3.124053 2.0761956 4.700765
soclass   1.001050 0.9930815 1.009083

-2 x log-likelihood:  237.4882 

那么,与 206 或 1083 的结果相比,我应该如何解释 237.4882 的值?非常感谢您的帮助!

2个回答

最大似然估计通过尝试最大化似然来工​​作。由于对数函数严格递增,最大化对数似然将最大化似然。我们这样做是因为可能性是非常小的数字的产物,并且在计算机上往往会很快下溢。对数似然是负数的总和,除了病理情况外不会溢出。乘以 -2(并且 2 来自Akaike 和线性回归)将最大化问题变成了最小化问题。因此,可以认为回归的 MLE 实现通过最小化负对数似然 (NLL) 来工作。

因此,NLL越低,拟合越好。然而,这会导致过度拟合,因为添加更多参数将更好地拟合观察到的数据,从而使拟合的方差更大:它将更差地拟合新数据。信息标准度量(如 AIC、AICc 等)具有与参数数量、数据或两者相关的其他术语,有助于改善使用过度参数化分布的趋势。

为了至少从似然 L 中获得一些意义,您可以记住,对于固定样本计数 N,某个分布模型的最大对数似然主要取决于规模。对于给定的方差,正态分布具有最高值。为了获得一些见解,我会将 logL 除以 N,然后可能还会对比例进行校正。如果您的数据更适合均匀分布,那么最好使用均匀似然作为给定范围的最大熵函数作为一种参考。另一个通用参考值可能是连续情况下使用 KDE 拟合,并为此计算 L。然而,无论你做什么 L 都比 KS 值或 rms 误差更难解释。
如果您采用另一个模型并获得更高的 L,那么这并不意味着该模型更好,因为您可能处于过度拟合的情况。要包括这一点,请使用 AIC 值。这里越低越好,您可以再次使用正态分布作为“参考”。