指数分布的拟合优度检验

机器算法验证 自习 卡方检验 拟合优度 指数分布
2022-03-29 19:09:05

下面给定的数据显示了连续白色汽车在开放道路上流动的交通之间的时间间隔(以秒为单位)。这些可以通过指数分布建模。

Time        0-     20-      40-     60-      90-     120-180
Frequency   41     19       16      13        9        2

我的问题是,当我计算预期频率时,尽管总数应为 100,但由于四舍五入错误,它不会这样做吗?
我得到的值为 98.89。
这里是否需要我自己添加另一个类别作为区间为180-infinity并获得其预期值为 100-98.89=1.11。是否有必要添加此类别,因为这是一个无穷大的指数分布?
当然,由于创建的类别的预期值小于 5,在这种情况下,我必须将其与上一个类别相加。
但是如果我不考虑这个新类别那么自由度会发生变化。是否有必要将这个新类别添加为180-infinity

1个回答

首先,重新排列表格,使其更有意义:并通过calculator.calculator 计算平均值。为了做到这一点,将每个时间间隔的中点作为时间,并将其与频率一起输入到显示屏上。你应该得到 40。但是这是平均值,所以要得到 lambda,使用下面的公式 lambda = 1/mean 这应该给你一个 0.025 的 lambda 值。使用此函数和累积 pdf (1-e-^lambda x 时间间隔) 函数来计算每个的 p(X=x) 和总计 x 以获得预期的每个。因为我们处理的是连续分布,所以第一个和最后一个间隔应计算为小于 20 且大于 120。即第一次计算将是 1-e-^0.025x20=0.3935(保持至少 4dp).. 第二将是 (1-e-^0.025x40) - (1-e-^0.025x20) = 0.2387.. 继续,直到完成 ll 间隔,如上所示。

Time           0-20   20-40    40-60    60-90   90-120       120-180     total
Frequency        41      19       16       13        9       (11)  2       100
p(X=x)       0.3935  0.2387   0.1447   0.1177   0.0556        0.0497         1 (about!)
Expected      39.35   23.87    14.47    11.77     5.56  (10.53) 4.97   (combine last two)
(O-E)^2/E   0.06919 0.99359  0.16178  0.12854  0.02098    1.37 (3sf)

H0:数据服从指数分布
H1:数据不服从指数分布(即使用 5% SL)

DF = 5-1-1 = 3(总数为 1,从总体估计 lambda 为 1)
X (cv)= 7.815

1.37 < 7.815 所以接受 H0。可以通过指数分布对连续白色汽车在开放道路上的流动交通中的间隔时间(以秒为单位)进行建模。

我做了 A2 Statistics,它本身就是一个可靠的来源。