2.04 标准误的含义?显着不同意味着当置信区间广泛重叠时?

机器算法验证 置信区间 标准错误
2022-03-16 19:42:07

下图来自《心理科学》上的这篇文章一位同事指出了两点不同寻常的地方:

  1. 根据标题,误差条显示“±2.04 标准误差,95% 置信区间”。我只见过±1.96 SE 用于 95% CI,我找不到任何关于 2.04 SE 用于任何目的的信息。2.04 SE 有一些公认的含义吗?
  2. 文本指出,计划的成对比较发现,错误与正确的可预测试验 (t(30)=2.51, p<.01) 和错误与正确的不可预测试验 (t(30)=2.61, p <.01)(综合 F 检验在 p<.05 时也很显着)。但是,该图显示了所有三个条件的误差条基本重叠。如果 ±2.04 SE 区间重叠,p<.05 时的值如何显着不同?重叠足够大,我假设±1.96 SE 间隔也重叠。

显示 2.04 SE 误差条的条形图

2个回答
  1. 2.04是与具有 31 个自由度的学生 t 分布一起使用的乘数。报价单建议30自由度是适当的,在这种情况下,正确的乘数是2.0422722.04.

  2. 均值根据标准误进行比较。标准误通常是1/n乘以标准差,其中n(大概在30+1=31这里)是样本量。如果标题正确地将这些条称为“标准错误”,则标准偏差必须至少为315.5大于大约值的倍数6如图所示。的数据集31正值,标准差为6×5.5=33和之间的平均值1418必须有最接近的值0以及少数惊人的大值,这似乎不太可能。(如果是这样,那么基于 Student t 统计量的整个分析无论如何都是无效的。) 我们应该得出结论,该图可能显示标准偏差,而不是标准误差

  3. 均值的比较不是基于置信区间的重叠(或缺乏重叠)。两个 95% 的 CI 可以重叠,但仍然可以表示非常显着的差异。原因是独立)均值的标准误差至少近似地是均值标准误差平方和的平方根。例如,如果平均值的标准误14等于1和平均值的标准误17等于1,然后是第一个均值的 CI(使用2.04) 将从11.9216.08第二个的 CI 将从14.9219.03,有很大的重叠。然而,差异的 SE将等于12+121.41. 手段的不同,1714=3, 大于2.04乘以这个值:它很重要。

  4. 这些是成对比较。 各个值可能表现出很大的可变性,而它们的差异可能是高度一致的。例如,一组对,如(14,14.01),(15,15.01),(16,16.01),(17,17.01), 等等, 表现出每个组件的变化, 但差异是一致的 0.01. 尽管与任一组件相比,这种差异很小,但其一致性表明它具有统计学意义。

这里的部分混乱是数据的混乱表示。这似乎是一种重复测量设计,但误差线是估计真实平均值的置信区间。重复测量的主要目的是避免收集足够的数据来获得对原始平均值的质量估计。因此,所呈现的误差条实际上与所讲述的故事几乎没有关系。关键利益的价值就是效果。图表的目的是突出故事的要点,绘制效果及其置信区间会更合适。