我认为在考虑您的问题时,如果您尝试牢记零假设显着性检验 (NHST) 的目标/卖点,这会有所帮助;它只是统计推理的一种范式(尽管非常流行),其他范式也有自己的优势(例如,有关 NHST 相对于贝叶斯推理的讨论,请参见此处)。NHST 的最大好处是什么?:长期错误控制。如果您遵循 NHST 的规则(有时这是一个非常大的 if),那么从长远来看,您应该对自己做出的推论有多大可能出错有一个很好的认识。
NHST 的挑剔规则之一是,无需进一步更改您的测试程序,您只需查看您感兴趣的测试。实践中的研究人员经常忽略(或不知道)这条规则(参见 Simmons 等人,2012 年),在添加数据波后进行多次测试,检查他们的p-在模型中添加/删除变量等后的值。问题是研究人员很少对 NHST 的结果持中立态度;他们敏锐地意识到,显着的结果比非显着的结果更有可能被发表(出于误导和合理的原因;Rosenthal,1979)。因此,研究人员经常被激励添加数据/修改模型/选择异常值并反复测试,直到他们“发现”显着效果(参见 John 等人,2011,一个很好的介绍)。
上述实践产生了一个违反直觉的问题,在 Dienes (2008) 中有很好的描述:如果研究人员将不断调整他们的样本/设计/模型直到达到显着性,那么他们期望的假阳性发现的长期错误率(通常)和假阴性结果(通常是)将分别接近 1.0 和 0.0(即,无论是假的还是真的α=.05β=.20H0
在您的特定问题的上下文中,当研究人员不想对效应的方向做出特定预测时,他们会默认使用双尾检验。如果他们的猜测是错误的,并且在效应方向上进行单尾检验,他们的长期将被夸大。如果他们查看描述性统计数据并根据他们对趋势的观察进行单尾检验,他们的长期将被夸大。你可能认为这不是一个大问题,在实践中,值失去了它们的长期意义,但如果它们不保留它们的意义,那么你为什么要使用一种推理方法的问题优先考虑长期错误控制。ααp
最后(并且作为个人喜好问题),如果您首先进行双尾测试,发现它不重要,然后按照第一个测试暗示的方向进行单尾测试,我会遇到更少的问题,并且如果(且仅当)您在另一个样本中对该效果进行了严格的验证性复制,并在同一篇论文中发表了复制,则发现它很重要。只要您能够在没有相同分析灵活性的新样本中复制您的效果,探索性数据分析——使用错误率夸大灵活的分析实践——就可以了。
参考
Dienes, Z. (2008)。将心理学理解为一门科学:科学和统计推理导论。帕尔格雷夫麦克米伦。
John, LK, Loewenstein, G. 和 Prelec, D. (2012)。用讲真话的激励措施来衡量可疑研究实践的普遍性。心理科学,23(5),524-532。
罗森塔尔,R. (1979)。文件抽屉问题和对空结果的容忍度。心理公报,86(3),638。
Simmons, JP, Nelson, LD 和 Simonsohn, U. (2011)。假阳性心理学:数据收集和分析中未公开的灵活性允许呈现任何重要的东西。心理科学,22(11),1359-1366。