我有非正态分布的数据。问题似乎是一个值相对于其他值太多。
我试图使数据正常:
- 我尝试了对数转换,将所有值加 1(即,相对频繁的值是 0,我知道不能对 0 的值执行对数转换),但这并没有修复数据,也没有改变夏皮罗- 来自 p<.001 的 Wilk 显着性甚至是轻微的。
- 我还读到方差分析不需要因变量呈正态分布,而只需要残差呈正态分布。然而,残差之间仍然存在显着差异,如另一项 Shapiro-Wilk 检验所示。
Box-Cox 变换能否使数据呈正态分布?
- 一个来源(第 27 页)表明,在对数转换不起作用后,使用 Box-Cox 转换是另一种可能的解决方案。然而,问题是我知道这个用于 Box-Cox 转换的函数在 SPSS 上不可用。
- 我还没有找到这种转换的有效语法,我不熟悉 R,我理解它可以执行 Box-Cox 转换,并且我有提交报告的截止日期,这意味着我没有时间熟悉 R,并且我无法购买 Excel 统计软件包。
数据
- 添加数据的直方图以更好地了解下面的数据可能很有用。
- 这是一种重复测量设计,每个参与者都有直方图中所指的低负载和高负载条件。
- 正如我们的假设所预测的那样,高负载条件应该不会导致非常少的“图像”(即入侵),因此数据支持我们的假设。因此,预期以某种方式行动的数据在其正常性方面存在问题似乎很奇怪,因为在某些情况下它被认为是不正常的。
- 也许我误解了某些东西或进行了不正确的测试,所以如果是这样,那么很高兴知道。
为什么不进行非参数分析?
- 我更喜欢进行参数测试,因此我想让数据呈正态分布;这可能是一个错误的观点,但是从阅读许多文章来看,我很少看到在报告数据时使用非参数分析的论文。
- 只有当我拥有的数据似乎无法将其转换为参数数据时,我才必须使用非参数测试,但首先我想尝试转换数据的选择。
问题
1) 使用 Box-Cox 转换来尝试修复数据是一个好主意,还是我没有尝试过的其他更好的主意?
2) 如果 Box-Cox 转换实际上是一个尝试的好主意,是否有任何关于如何做到这一点的建议(例如,是否是有关 SPSS 语法、Excel 公式等的信息)?
来自答案的信息:
- 这是计数数据
- 它具有泊松分布,因此具有这种分布的分析将是理想的
- 数据中有很多零,范围很小(即从 0 到 4 的值)
- Scortchi 在下面的评论中提供了很好的链接,以获取更多关于用零转换非负数据、测试两个重复测量计数变量之间的显着差异、计数通常为零时计数数据的回归模型以及使用泊松重复测量的信息方差分析。
- Poisson RM ANOVA 有很好的信息,关于使用这种分布来计算具有许多零的非参数数据的想法和理论。
- 由于我的下一步是了解在 SPSS 中对重复测量数据进行泊松分布分析的具体领域,因此我在这里提出了一个新问题。
- 尽管目标是使用泊松分布进行分析,但根据一个来源(页面中途,在原因 6:数据遵循不同的分布)看来,数据仍将保持非参数化。
(但是,如果我不应该像以前那样问一个单独但相关的问题,请告诉我,我会改变这个 - 我是新手,所以我仍然对在这里发布的惯例有所了解,但我很高兴学习并获得有关我如何发布的反馈,以使所有人更清楚。)

