显然,我不需要告诉你什么是 p 值,或者为什么过度依赖它们是一个问题;你显然已经足够了解这些事情了。
对于出版,您有两个相互竞争的压力。
第一个——也是你应该在每一个合理的机会中推动的一个——是做有意义的事情。
第二个,归根结底,是实际发布的需要。如果没有人看到你在改革糟糕的实践方面所做的出色努力,那么几乎没有什么收获。
因此,与其完全避免它:
其他学科也一样吗?
过度使用 p 值的问题出现在许多学科中(当有一些假设时,这甚至可能是一个问题),但在某些学科中比在其他学科中要少得多。一些学科确实存在 p-value-itis 的问题,而导致的问题最终会导致一些过度夸大的反应[2](在较小程度上,[1],至少在某些地方,其他一些以及)。
我认为有多种原因,但过度依赖 p 值似乎获得了自己的动力——说“重要”并拒绝人们似乎认为非常有吸引力的零值是有道理的;各个学科(例如,参见 [3][4][5][6][7][8][9][10][11])已经(取得了不同程度的成功)一直在与过度依赖p 值(特别是 = 0.05)多年来,并提出了许多不同类型的建议 - 并非所有我都同意,但我包含了各种观点,以对人们不得不做的不同事情有所了解说。α
其中一些主张关注置信区间,一些主张关注效应大小,一些主张贝叶斯方法,一些较小的 p 值,一些只是避免以特定方式使用 p 值,等等。有很多不同的观点来代替做什么,但是在他们之间有很多关于依赖 p 值的问题的材料,至少它是非常普遍的做法。
依次参见这些参考资料以获取更多参考资料。这只是一个示例——可以找到更多的参考资料。一些作者给出了他们认为 p 值普遍存在的原因。
如果您确实想与编辑争论这一点,其中一些参考资料可能会很有用。
[1] Halsey LG、Curran-Everett D.、Vowler SL 和 Drummond GB (2015),
“变化无常的 P 值产生不可重现的结果”,
Nature Methods 12 , 179–185 doi:10.1038/nmeth.3288
http://www .nature.com/nmeth/journal/v12/n3/abs/nmeth.3288.html
[2] David Trafimow, D. 和 Marks, M. (2015),
社论,
基础和应用社会心理学,37 :1-2
http://www.tandfonline.com/loi/hbas20
DOI: 10.1080/01973533.2015.1012991
[3] Cohen, J. (1990),
Things I have learned (so far),
American Psychologist , 45 (12), 1304–1312。
[4] Cohen, J. (1994),
地球是圆的 (p < .05),
American Psychologist , 49 (12), 997–1003。
[5] Valen E. Johnson (2013),PNAS
统计证据修订标准
,第一卷。110,没有。48, 19313–19317
http://www.pnas.org/content/110/48/19313.full.pdf
[6] Kruschke JK (2010),
相信什么:数据分析的贝叶斯方法,
认知科学趋势 14 (7), 293-300
[7] Ioannidis, J. (2005)
为什么大多数已发表的研究结果都是错误的,
PLoS Med。八月; 2(8):e124。
doi: 10.1371/journal.pmed.0020124
[8] Gelman, A. (2013),P 值和统计实践,
流行病学卷。24号 1 月 69-72
[9] Gelman, A.(2013 年),
“p 值的问题在于它们的使用方式”,
(关于“为 P 值辩护”的讨论,Paul Murtaugh 为生态学)未发表
http:// citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.300.9053
http://www.stat.columbia.edu/~gelman/research/unpublished/murtaugh2.pdf
[10] Nuzzo R. (2014),
统计误差:P 值,统计有效性的“黄金标准”,并不像许多科学家认为的那样可靠,
新闻和评论,
自然,卷。506 (13)、150-152
[11] Wagenmakers E,(2007)
P 值普遍问题的实用解决方案,
Psychonomic Bulletin & Review 14 (5), 779-804