这个问题是我的上司提的,我不知道怎么解释。
通常接受的置信水平是 0.95,这意味着 1 类错误的概率是 5%。但通常接受的功效是 0.8 (Cohen, 1988),这意味着 2 类错误的概率是 20%。为什么我们可以接受比类型 1 错误更高的类型 2 错误的概率?这背后有什么统计原因吗?
他还问了power = 0.8的物理含义(为什么选择它作为标准),我也不知道解释它。
而当我们使用功效分析来设计实验时,我们可能会选择有效尺寸 0.3、0.5 或 0.8 来代表小、中、大效果。我的主管问为什么选择这些数字。我的理解是这些数字是根据经验建议的。他马上问我是什么体验。对于这样的问题,我真的很沮丧。我的专业不是统计学,我需要花很多时间在这样的问题上,我认为这可能没有意义。有人可以建议这些问题是否真的有意义吗?如果是,我该如何找到答案。