我们在这里有帖子讨论为什么事后功率计算存在缺陷。
我们可以捕捉到的影响大小的事后计算呢?这在逻辑上似乎是等价的。如果我们不应该计算检测效果的功效,那么我们不应该计算我们可以用功效检测到的效果。
(也许这需要一个单独的问题,但样本量和进行事后计算是否无效?(我在想 R 的包将如何计算一个如果你给其他人,就像我第一次加入 Cross Validated 时发布的那样。)但我主要想谈谈效应大小的事后计算。)pwr
例子
我们有来自两组的观察结果,并对他们的平均值进行 t 检验,得出:在时不显着。
我们想声明组的等价性,但 SME 不确定效果大小有多小才能保证等价性。“告诉我们你能检测到什么样的效果,”他们告诉我。“我们会回来说这种影响是否重要。”
我知道我们喜欢使用的标准和的功效进行操作,因此我使用样本大小、水平、功效和观察到的方差来计算我可以检测到的效果大小。的效应大小。”
如果我要翻转问题以获得感兴趣的效果大小,例如,并计算出我们有的功率来检测这种差异,这似乎是一个无效的事后功率计算。似乎事后效应大小计算同样无效。
编辑
实际上,它来自 Rebecca A. Betensky 的一篇论文:“The p-Value Requires Context, Not a Threshold”。她展示了如果我们声明一个感兴趣的效应大小该怎么做。我可以想象她的方法被转过来让我回答我们可以检测到什么样的效果。