我有一个数据集,其中包含个人在 7 天内执行的操作数量。具体操作不应该与这个问题相关。以下是数据集的一些描述性统计数据:
这是数据的直方图:
从数据来源来看,我认为它符合泊松分布。但是,均值≠方差,并且直方图的权重偏向左侧。此外,我goodfit
在 R 中运行测试并得到:
> gf <- goodfit(actions,type="poisson", method = "MinChisq") <br>
> summary(gf) <br>
Goodness-of-fit test for poisson distribution <br>
X^2 df P(> X^2) <br>
Pearson 2.937599e+248 771 0
最大似然法也产生 p 值 = 0。假设原假设是:数据匹配泊松分布(文档没有具体说明),那么goodfit
测试表明我们应该拒绝原假设,因此数据不匹配泊松分布。
那分析正确吗?如果是这样,您认为哪种分布适合这些数据?
我的最终目标是比较 2 个样本之间的平均动作次数,看看平均值是否不同;检查分布是否有必要?我的理解是典型的测试(z-,t-,测试)不适用于泊松分布。如果数据确实是泊松分布的,我应该使用什么测试?