我想知道或使用 95% 置信区间的历史是什么。我知道更细致入微的推理会认为 0.05 或 95% 没有什么特别之处(我认为决策理论提供了关于接受何种风险水平的指导),并且这些数字的使用更多地与“传统”和做事有关统计课程中所教的内容本身并没有讨论为什么应该很好地使用这些数字。
是不是费舍尔建议小到足以放弃假设,并且主要只是作为建议而不是规则?还是我错了?
我想知道或使用 95% 置信区间的历史是什么。我知道更细致入微的推理会认为 0.05 或 95% 没有什么特别之处(我认为决策理论提供了关于接受何种风险水平的指导),并且这些数字的使用更多地与“传统”和做事有关统计课程中所教的内容本身并没有讨论为什么应该很好地使用这些数字。
是不是费舍尔建议小到足以放弃假设,并且主要只是作为建议而不是规则?还是我错了?
费舍尔间接建议了 0.05 水平。他提到两个标准差是一个简单的显着性规则,0.05 水平是大约对应的水平。
来自费舍尔 1925 年的“研究人员的统计方法”
因此,如果我们知道总体的标准差,我们就可以计算任意大小的随机样本均值的标准差,从而检验它是否与任何固定值有显着差异。如果差值比标准误大很多倍,那肯定是显着的,方便的约定是取两倍标准误作为显着性界限;这大致相当于对应的限制,已经用于分布。
他还提到已经使用了这个级别。这指的是 Pearson 的卡方检验。在同一本书中,他写了一个关于分布值的表的构造
我们没有重印埃尔顿的表格,而是给出了一个新的表格(表 III. p. 98),其形式经验表明更方便。我们没有给出对应于任意一系列值的值,而是给出了对应于特殊选择的值。因此,我们能够以紧凑的形式涵盖迄今为止不可用的分布的那些部分,即的值小于统一,这经常发生在的小值和超过的值,对于较大的值变得很重要。
...
在准备此表时,我们牢记在实践中我们不想知道任何观察到的确切值,但是,首先,观察到的值是否值得怀疑。如果介于和之间,则肯定没有理由怀疑所检验的假设。如果它低于,则强烈表明该假设无法解释全部事实。处画一条常规线,我们不会经常误入歧途,并认为的较高值表示真正的差异。
所以 0.05 级别源于两种便利性。
请参阅Stigler (2008) 在Chance中的这篇历史文章,关于费舍尔的影响(如您所建议的那样)。
许多早期显着性检验使用标准正态分布。随着截止值小于,尾部概率迅速减小。因此,如果一个人想要一个相对较小的尾部概率而不坚持太远附近的截止点在更极端的 z 值和更小的概率之间提供了一个合理的折衷。如果想要两个尾概率之和的“整数”,例如那么接近的值似乎是合理的。
p = seq(.01,.1,by=.01); z = qnorm(p)
plot(z, p, ylim=c(0,.1))
我记得,确实是费舍尔把 0,05 作为建议扔了出去,从那时起,这在许多圈子里都被视为法律。我手头没有这本书,但我读了一遍这段话,可能可以通过快速的谷歌搜索找到它。
我对决策理论不太熟悉,所以我不能肯定地说费舍尔是唯一的原因。