我正在阅读 Gelman & Carlin “超越功率计算:评估 S 型(符号)和 M 型(幅度)错误”(2014 年)。我试图理解主要思想,主要途径,但我很困惑。谁能帮我提炼精华?
这篇论文是这样的(如果我理解正确的话)。
- 心理学的统计研究经常受到小样本的困扰。
- 以给定研究中具有统计学意义的结果为条件,
(1) 真实效应大小可能被严重高估,
(2) 效应的符号很可能相反——除非样本量足够大。 - 以上是使用人口中效应大小的先前猜测来显示的,并且该效应通常被认为是很小的。
我的第一个问题是,为什么要以统计显着性结果为条件?是为了反映发表偏倚吗?但情况似乎并非如此。那为什么呢?
我的第二个问题是,如果我自己进行研究,我是否应该以不同于以往的方式对待我的结果(我做频率统计,对贝叶斯不太熟悉)?例如,我将获取数据样本,估计模型并记录一些感兴趣的效应和围绕它的置信区间的点估计。我现在应该不相信我的结果吗?或者如果它在统计上显着,我应该不相信它?任何给定的先前改变是如何改变的?
(1)对于统计研究的“生产者”和(2)对于应用统计论文的读者来说,主要的收获是什么?
参考:
- 格尔曼、安德鲁和约翰·卡林。“超越功率计算:评估 S 型(符号)和 M 型(幅度)错误。” 心理科学观点9.6(2014):641-651。
PS我认为这里的新元素是包含先前的信息,我不确定如何处理(来自常客范式)。