似然比检验和边界参数

机器算法验证 假设 似然比
2022-03-28 01:23:52

如果模型的参数位于参数空间的边界上,则似然比检验 (LRT) 中检验统计量分布的卡方近似值可能不可靠——这是我经常在文档中看到的内容。我想知道“参数空间的边界”的真正含义。例如,如果它是二项分布的概率参数,只有 p=0 还是 p=1?或者这是否包括边界周围的值(例如,p=0.001 在边界附近会导致问题?)?如果它包括接近边界值,如何确定一个值是否接近?

1个回答

我对“参数空间的边界”这个短语的理解是,模型中参数的可能值被限制在两个值之间,或者被限制在下/上端。

经常出现这种情况的区域是随机或混合效应模型,其中模型中的一个或多个参数用于随机效应项的方差。方差不能为负,因此,如果比较具有和不具有特定随机效应项的模型,则没有该项的模型假定方差参数的值为 0。但 0 位于可能值的下边界该参数可以采用,但默认 LRT 假定该参数可能为负值。因此,对使用卡方分布的可靠性的评论d在这种情况下,检验统计量的自由度。

将该情况与线性(混合)模型中固定效应项的参数进行比较。这个参数是高斯随机变量的估计平均值,理论上它可以取任何值,因此在 LRT 中我们可能正在比较一个模型并且没有这个固定效应项(因此设置β^=0在没有术语的模型中),更简单模型的参数(β^=0) 不在允许值集的边界。