我正在运行一项包含组间组件和组内组件的研究,其预测变量是计数数据。我打算使用裂区方差分析来分析这个,但是在这里看到很多问题之后,通常说方差分析对计数数据不好,但没有一个答案说明原因。这仅仅是计数数据通常不是正态分布的问题吗?如果是这种情况,如果计数数据实际上是正态分布的,那么裂区方差分析是否合适?
使用计数数据进行 ANOVA 测试的具体问题是什么
机器算法验证
正态分布
方差分析
造型
计数数据
裂区
2022-03-25 23:05:54
1个回答
计数数据不能真正具有正态分布,除非作为大计数情况下的近似值。但这不是主要原因:
计数数据没有恒定的方差。对于最常用的模型,泊松分布,方差等于均值,对于许多其他合理的模型(集群过程,例如人们分组到达某个地方),方差与均值成正比。即使在今天有时也有用的经典解决方案是平方根变换,它可以稳定方差。请参阅为什么建议对计数数据使用平方根转换?.
计数是广泛的变量,而不是密集的。请参阅拟合优度以及选择线性回归或泊松的模型
正如评论中提到的,序数回归模型是一种可能性。有关详细信息,请参阅GLM,其中连续数据堆积为零 ,尤其是 F. Harrell 的答案。
今天,用count数据大多认为泊松回归(或变体),这是一个glm(广义线性模型),至少作为一个起点。但是您仍然可以使用 anova 思维,因为 anova 中使用的所有实验设计思想也可以与广义线性模型一起使用!因此,您仍然可以使用带有泊松回归的裂区模型。
其它你可能感兴趣的问题