《自然科学家评论》的标题反对统计意义的开头是:
Valentin Amrhein、Sander Greenland、Blake McShane 和 800 多名签署者呼吁结束大肆宣传并消除可能的关键影响。
后来包含如下语句:
同样,我们并不提倡禁止 P 值、置信区间或其他统计措施——只是我们不应该断然对待它们。这包括统计显着与否的二分法,以及基于其他统计度量(如贝叶斯因子)的分类。
我想我可以理解,下图并没有说这两项研究不同意,因为一项“排除”没有效果,而另一项则没有。但是这篇文章似乎比我能理解的要深入得多。
到最后似乎有四点总结。对于我们这些阅读而不是编写统计数据的人来说,是否可以用更简单的术语来总结这些?
在谈论兼容性间隔时,请记住四件事。
首先,仅仅因为区间给出了与数据最兼容的值,给定假设,并不意味着它之外的值是不兼容的;他们只是不太兼容......
其次,考虑到假设,并非所有内部值都与数据同样兼容......
第三,就像它来自的 0.05 阈值一样,用于计算间隔的默认 95% 本身就是一个任意约定......
最后,也是最重要的一点,保持谦虚:兼容性评估取决于用于计算区间的统计假设的正确性......