一些风格指南指示作者不仅要报告假设检验的结果,还要报告计算它的检验统计量的值。例如,APA 风格建议 t( DOF)= t statistic, p=p value用于报告 t 检验的结果,如以下示例所示,取自此处¹。
一个样本:“年轻的青少年比一般青少年更早醒来(M = 7:30,SD = .45),t(33) = 2.10, p = 0.31”
依赖/独立样本:“年轻的青少年对电子游戏(M = 7.45,SD = 2.51)的偏好明显高于书籍(M = 4.22,SD = 2.23),t(15) = 4.00,p < .001。”
值显然很有用²,因为它可以告诉您在零假设下结果是否不太可能。描述性统计对于理解数据/主题池的特征以及任何声称的影响的大小非常重要。
统计量(或测试的类似统计量)似乎更像是一个中间步骤,需要从另一个中获取一个。同样,自由度通常与数据点的数量密切相关,但的实际值似乎更容易解释。
包括测试统计数据如何帮助我解释这些结果?它仅仅是约定俗成的,是对荟萃分析的帮助,还是精明的读者可以从这些数字中学到一些东西?
我对“简单”测试的情况特别感兴趣;我可以想象会告诉您一些关于 ANOVA 设计的信息,而这些信息可能从书面描述中不清楚。
这些例子对我来说实际上并不是很好。例如,受试者内差异的平均值会提供更多信息。
当然,在 NHST 框架中。假设我们很乐意为这个问题工作。