您的示例中类的重叠有点令人困惑,所以我将使用一些稍微修改的值
No. of days 0-5 6-9 10-13 14-19 20-27 28-30 38- 40
No. of students 11 10 7 4 4 3 1
该问题的近似值,不假设您所说的类内对称,将是缺席的天数遵循几何分布:
P(X=k)=(1−p)kp
作为第一个近似值,我们假设一个类中的每个值都以相同的概率出现。例如,观察到 0 个缺席天数次。116
的最大似然估计是p
p^=nn+∑ni=1ki=4040+0⋅116+1⋅116+…+39⋅13+40⋅13=0.0786
使用这个值,我们现在可以返回并更正因为我们假设一个类中的每个值都以相同的概率出现。对于类,我们有
由于该类中的观察总数为 11,我们得到的预期观察次数为:p0−5P(X=0)=(1−p)0p=0.0786P(X=1)=(1−p)1p=0.0724P(X=2)=0.0667P(X=3)=0.0615P(X=4)=0.0566P(X)=5)=0.0522
k=0
11⋅0.07860.0786+0.0724+0.0667+0.0615+0.0566+0.0522=2.228
对于,发现预期均值是。其余课程类似。如果我们随后更新 p 的最大似然估计我们得到。这可以重复直到收敛。的收敛值,我们就可以得到几何分布的平均值k={1,2,3,4,5}{2.053,1.891,1.743,1.606,1.48}pp^=0.0797p
1p−1