语境
一组社会科学家和统计学家 ( Benjamin et al., 2017 ) 最近提出,用作确定“统计显着性”的阈值 = .05) 需要调整到更保守的阈值( = .005)。一群相互竞争的社会科学家和统计学家(Lakens 等人,2018 年)做出了回应,反对使用这个——或任何其他——任意选择的阈值。以下是来自 Lakens 等人的引述。(第 16 页)这有助于举例说明我的问题的主题:
理想情况下,alpha 水平是通过使用决策理论将成本和收益与效用函数进行比较来确定的。与从难以获得的样本中收集数据相比,在分析大型现有数据集时,这种成本效益分析(以及阿尔法水平)是不同的。科学是多种多样的,由科学家来证明他们决定使用的阿尔法水平的合理性。... 研究应该以严谨的科学原则为指导,而不是启发式和任意的阈值。
问题
我想知道如何以一种“以严格科学原则为指导”的方式来证明所选择的 alpha 的合理性,如 Lakens 等人。建议,在大多数社会科学背景下(即,在某些情况下,一个人具有更具体的质量,如利润,需要优化)?
随着 Lakens 等人的传播,我开始看到在线计算器在流通,以帮助研究人员做出这个决定。使用它们时,研究人员需要指定假阳性和假阴性错误的“成本比”。然而,正如这里的计算器所暗示的,确定这样的成本比率可能涉及大量的定量猜测工作:
虽然一些错误成本很容易以货币形式量化(直接成本),但另一些则难以用美元计算(间接成本)。...尽管量化具有挑战性,但您应该努力给他们一个数字。
例如,虽然 Lakens 等人。建议研究难以到达的样本作为人们在证明 alpha 时可能考虑的一个因素,似乎人们仍然在猜测该样本有多难到达,因此,如何相应地调整 alpha 的选择。再举一个例子,我似乎很难量化发布假阳性的成本,即其他人随后会在错误推断的前提下投入多少时间/金钱来进行研究。
如果确定这个成本比率在很大程度上是一个主观的最佳猜测问题,我想知道这些决定是否可以(再次,除了优化利润之类的东西)是“合理的”。也就是说,以某种方式存在于对抽样、权衡、影响等的假设之外,?通过这种方式,在我看来,确定假阳性/假阴性错误的成本比率类似于在贝叶斯推理中选择先验——这个决定可能有点主观,会影响结果,因此会引起争论—— - 虽然我不确定这是一个合理的比较。
概括
为了使我的调查具体:
- 在大多数社会科学背景下,假阳性/假阴性率及其成本比率是否可以“严格”证明?
- 如果是这样,人们可以遵循哪些可推广的原则来证明这些分析选择的合理性(可能是其中的一两个例子)
- 如果不是,我对选择成本比率的潜在主观性的类比——类似于贝叶斯先验选择——是否合理?
参考
Benjamin, DJ, Berger, J., Johannesson, M., Nosek, BA, Wagenmakers, E.,... Johnson, V.(2017 年 7 月 22 日)。重新定义统计显着性。取自 psyarxiv.com/mky9j
Lakens, D., Adolfi, FG, Albers, CJ, Anvari, F., Apps, MA,... Zwaan, RA(2018 年 1 月 15 日)。证明你的阿尔法。取自 psyarxiv.com/9s3y6