VGAM 拟合 beta 二项式模型

机器算法验证 r β-二项分布
2022-03-26 05:13:46

鉴于此,我有一个小问题:

fit <- vglm(cbind(R, N-R) ~ 1, betabinomial, lirat, trace=TRUE, subset=(N > 1))

我为什么要这样做cbind(R, N-R)有人可以向我解释这个简单的步骤吗?如果我遗漏了那部分,我会收到一条错误消息,说我只能适合0, 1. 但在此处的示例中,可以包含许多不同的值。Y

1个回答

二项式分布是在已知的、有限数量的“试验”中“成功”数量的分布(例如,在一定数量的硬币翻转中出现正面)。在成功概率和试验次数固定的情况下,成功次数的方差也是固定的。典型的逻辑回归场景将伯努利数据(单次抛硬币)作为其响应,但是当您有的二项式数据时,您会发现响应数据的变化超出了应有的范围。在这种情况下,将违反二项式 GLiM 的假设。 πnn>1

贝塔二项分布放宽了这个假设。它包含三个参数,,这给了它额外的灵活性来解决上述情况下的过度分散问题。然而,这里重要的一点是,过度分散/更大的方差只能存在于次试验中成功计数的数据中。因此,(或任何其他软件)需要数据以适合模型的形式出现。 ,例如,使用事件/试验使用,这是等价的。(对于它的价值,在您链接到的文档页面中,我只在列出的示例中看到。) n,α,&βn>1RSASRcbind(successes, failures)cbind(successes, failures)