估计 GLM 和负二项分布的预测区间的方法

机器算法验证 广义线性模型 负二项分布 预测区间
2022-04-06 14:20:43

我使用 Monte-Carlo 方法使用负二项分布估计来自 GLM 的新观测值的预测区间。我将这种方法用于线性模型并得到了预测区间的可靠估计,但我对统计数据没有足够的信心知道这种方法是否也可以应用于非高斯分布。你能告诉我使用它是否有意义吗?

方法:

  1. 使用 Wald 方法(在链接上)计算期望值的 se。
  2. 使用这个 se 从高斯分布中随机简单 1000 个值,期望值为μ并且作为σ.
  3. 对于每个随机值,从负二项分布中随机抽取 1000 个值,随机值的指数为 mu。
  4. 预测区间计算为给定预期值获得的 1e6 个随机值的 2.5 和 97.5 分位数。

这种方法有意义吗?

问候,马克西姆

1个回答

如果你正在服用它是有道理的θ众所周知。如果你想将不确定性纳入θ您可以从其他参数的联合分布(渐近高斯)中进行模拟,并且θ,或者您可以有条件地模拟另一个(因为θ是 GLM 的输入,我建议模拟θ从正态近似到其轮廓似然,然后μ从条件μθ,因为您从 GLM 中获得了那一点信息)。然后按照上述方法模拟负二项式。

这与 Ripley 讨论过的一种方法非常相似(例如在 R-help 邮件列表中)——例如这里(尽管他在那个方面特别简洁)。

[如果有人对这种方法有参考,它将很好地完善这个问题的答案。]