最近讨论的一个热门话题涉及一个期刊,该期刊禁止在提交给该期刊的文章中使用“零假设统计检验程序 (NHSTPs)”。我看到一些作家使用了这个术语,但我不明白他们试图做出什么区分。NHSTP 与“假设检验”或“显着性检验”有何不同?
“零假设统计检验”与任何其他检验有什么区别?
背景:有问题的社论是来自Basic and Applied Social Psychology的一篇,该期刊 2015 年影响因子为 1.168,即不被高度引用。
回复:OP 问题,即 NHSTP 与“假设检验”或“显着性检验”不同吗?适用的编辑声明是
1) "...the null hypothesis significance testing procedure (NHSTP) is invalid..." [Sic, with alpha = 0.05]
2) "...authors will have to remove all vestiges of the NHSTP (p-values, t-values, F-values, statements about ‘‘significant’’ differences or lack thereof, and so on)."
3) "...confidence intervals [Sic, 95%] also are banned from BASP."
4) "...Bayesian procedures are neither required nor banned from BASP." [Sic, depends on which ones, they are either banned or not.]
5) "Are any inferential statistical procedures required?...No..."
为此提供的动机部分是“......bar 太容易通过了,有时可以作为低质量研究的借口。我们希望并预计,禁止 NHSTP 将通过将作者从 NHSTP 思维的僵化结构中解放出来,从而提高提交稿件的质量,从而消除创造性思维的重要障碍。”
对 OP 的回答:这些编辑可能会声称显着性检验通常是对假设的不恰当检验。例如,他们声明“……至少在某种程度上规避了拉普拉斯假设的贝叶斯提议 [原文如此,我先验地一无所知]……[这样] 甚至可能存在有充分理由假设数字确实存在......”这部分与上面@Livid指出的费舍尔与内曼和皮尔森的论点有关,社论将支持费舍尔。
讨论:我坚信智力谦逊是科学方法的基本和不可或缺的原则。如果我,作为一名研究人员,不允许从不相信所有先前理论的无假设的初始前提出发,那么我将失去以创造性和开放的心态检查数据的所有能力。所有数值处理都必须是绝对真理的前提是对崇高的贪婪的阐述。唯一的真理是数据,我会谦虚地解释一下Box通过声明所有模型都是错误的,尤其是那些假设任何真理都来自与数据本身不同的事物的模型。这并不意味着我必须在 Fisher 和 Neyman/Pearson 之间做出选择,而是我坚信这两个前提都不是单独存在的,而是要详尽地检查事情,直到我的假设被支持和/或拒绝以实现整体的自我一致性。只有自洽可以作为标准,因为没有任何分析可以揭示绝对真理。
我的做事方式并不适合所有人。许多人更喜欢在我称之为“自上而下”的严格控制实验设计中计划测试。然而,受控实验对于数据挖掘、模式识别和生成假设来说效率低下。它们对于测试狭窄的问题很有用,这就是可能出现关于 NHSTP 的争议的时候。如果没有支持证据,例如,一个完整的自洽结构可以依赖,任何一项测试都会受到批评。这可能被视为反向的 Bonferroni;如果多次测试导致一个不可避免的自洽集成,则该集成仅凭偶然发生的机会就会减少。在规划心理学实验时,关于不使用的废话是由于没有同时测试任何特定测试结果的所有含义,并且如果一个人不能容忍 I 类错误因为实验设计是如此的死板、受限和狭窄,那么使用. 然而,禁止一种特定的统计方法,因为它被无意识地使用并且无意识的工作在审查时通过了集合,仅仅意味着编辑在同意审查之前没有识别低质量的工作,也没有接触合格的审查员。当然,一个人不能基于单一的间接证据来建立合理的定罪。相反,一组间接证据会导致合理的定罪。因为它是间接的而消除整个类别的证据不会改善期刊的内容。