我们如何解释t检验p值和随机推断p值之间的差异?
假设我们有一个二元处理的随机实验,如果单元分配给处理,。
我们要测试治疗效果。
我们检验了没有效果的尖锐零假设和没有平均效果的零假设。
定义 : 无效果的尖锐零假设 所有受试者的治疗效果为零。形式上,对于所有。
定义:没有平均效应的零假设(有时称为弱零假设) 平均治疗效应为零。形式上,。
我们使用随机推理 (RI) ,并使用t。
如果我们运行这两个测试并得到不同的答案,那么解释t检验p值和 RI p值之间差异的有用方法是什么?
严格来说,这两个程序测试不同的假设,并且无法进行有意义的比较,但这不是很有用,并且不会满足想要了解您的结果为何看起来的非专家(对您的研究有实质性而非技术兴趣的人)使用 RI 或t检验时有所不同。此外,这两个测试是回答相同实质性问题的替代方法,“有治疗效果吗?” 我们应该有一个指导方针来思考对同一个实质性问题的不同答案。
一个好的答案应该对差异进行足够广泛的讨论,以涵盖 p 值的差异,这将导致我们得出不同的统计结论(例如,一个测试 p<0.05 和另一个 p>0.05)以及那些会导致得出相同结论的结论来自两个测试(例如,两个测试 p<0.05 或两个测试 p>0.05)。
RI注意事项
对于那些不熟悉 RI 的人:RI p 值的计算方法是,首先,计算所有(或许多)治疗分配中的检验统计量分布,称为零分布或随机分布。RI p 值表示大于我们观察到的检验统计量的随机分布的比例。(这里有更多讨论,特别是第 5 页。)
我们可以通过计算所有可能的置换治疗分配向量的检验统计量(计算精确的 RI p值)或使用大量置换治疗分配向量的样本(计算渐近的 RI p值)来进行 RI。正如Gerber 和 Green (2012)所写,“无论是使用所有可能的随机化还是其中的大样本,基于可能随机化清单的p值计算称为随机化推断。
