两个参数的泊松假设检验

机器算法验证 假设检验 泊松分布
2022-03-14 19:16:39

因此,为了好玩,我从我工作的呼叫中心获取了一些电话数据,并尝试对它们进行一些假设检验,特别是一周内接到的电话数量,并使用泊松分布来拟合它。由于我的工作主题,有两种类型的周,让我们称其中一种是在我假设有更多调用的周,以及我假设有更少的非周。

我有一个理论,即来自 on-weeks 的(我们称之为)大于来自非周的那个(我们称之为λλ1λ2

所以我要测试的假设是H0:λ1>λ2,H1:λ1λ2

我知道如何测试一个参数(比如 ),但不太确定如何在给定数据集的情况下执行 2。假设我从每个的非周数据和的一周数据中获取两周的数据。有人可以帮助我完成这个更简单的版本,以便我可以将其应用于更大的数据集吗?任何帮助表示赞赏,谢谢。H0:λ1>1,H1:λ11X1=2X2=3Y1=2Y2=6

4个回答

请注意,通常情况下相等是 null (有充分的理由)。

撇开这个问题不谈,我会提到几种检验这种假设的方法

  1. 一个非常简单的测试:以观察到的总计数为条件,将其转换为比例的二项式测试。想象一下有周和周和周的组合。nwonwoffw

那么在 null 下,期望的比例分别是您可以很容易地在一周内对比例进行单尾测试。wonwwoffw

  1. 您可以通过调整与似然比检验相关的统计量来构建单尾检验;例如,Wald 测试的 z 形式或分数测试可以进行单尾,并且应该适用于较大的λ

还有其他的方法。

刚刚使用带有泊松错误结构和日志链接的 GLM 怎么样?但是关于二项式的想法可能更强大。

我会用泊松或准泊松 GLM 来解决它,偏爱准泊松或负二项式。

使用传统泊松的问题在于它要求方差和均值相等,而这很可能并非如此。准泊松或 NB 估计不受均值限制的方差。

你可以很容易地在 R 中做任何这些。

# week on = 1, week off = 0
week.status <- c(1, 1, 0, 0)
calls <- c(2, 6, 2, 3)
model <- glm(calls ~ week.status, family = poisson())
# or change the poisson() after family to quasipoisson() 
# or use the neg binomial glm from the MASS package

GLM 方法是有益的,因为您可以扩展以包括可能影响呼叫量的其他变量(例如,一年中的月份)。

要手动完成,我可能会使用正态近似和两个样本 t 检验。

我们从泊松参数的最大似然估计开始,即均值。

所以,λ^1=Y¯  and  λ^2=X¯

现在,您可以简单地测试Y¯X¯N(λ1λ2,λ1n1+λ2n2)

然后通过获取 Z-Value=(Y¯X¯)λ1λ2λ1n1+λ2n2

注意:-拒绝标准是Z<Critical Value