问题
负二项式 (NB) 分布的方差始终大于其均值。当样本的均值大于其方差时,尝试以最大似然或矩估计拟合 NB 的参数将失败(没有有限参数的解)。
但是,从 NB 分布中提取的样本可能具有大于方差的均值。这是 R 中一个可重现的示例。
set.seed(167)
x = rnbinom(100, size=3.2, prob=.8);
mean(x) # 0.82
var(x) # 0.8157576
NB 将产生一个无法估计参数的样本的概率非零(通过最大似然法和矩量法)。
- 可以对这个样本给出适当的估计吗?
- 当没有为所有样本定义估计量时,估计理论会说什么?
关于答案
@MarkRobinson 和 @Yves 的回答让我意识到参数化是主要问题。NB的概率密度通常写为
在第一次参数化下,最大似然估计是每当样本的方差小于均值时,就没有什么有用的了. 在第二种情况下,它是, 所以我们可以给出一个合理的估计. 最后,@MarkRobinson 表明我们可以通过使用解决无限值的问题代替.
总之,这个估计问题没有根本性的错误,只是你不能总是给出有意义的解释和对于每个样本。公平地说,这些想法都存在于两个答案中。我选择了@MarkRobinson 作为他给出的补充的正确选择。