我一直在到处看到这句名言,但每次都无法理解强调的部分。
一个人暂时“拒绝”一个假设,根据习惯做法,当重要性在 1% 或更高的水平时,肯定会在不超过 1% 的此类决定中犯错。因为当假设正确时,他只会在其中 1% 的情况下犯错误,而当假设不正确时,他永远不会错误地拒绝。[...] 然而,这种计算是荒谬的学术性的,因为事实上没有一个科学工作者具有固定的重要性水平,年复一年,在任何情况下,他都拒绝假设;他宁愿根据他的证据和他的想法对每一个特定的案例进行思考。不应忘记,选择应用测试的案例显然是一个高度选择的集合,即使是单个工人也无法指定选择条件;也不是在所使用的论点中,一个人选择特定试验所指示的实际意义水平显然是非法的,就好像他一生的习惯只使用这个水平一样。
(统计方法和科学推理,1956 年,第 42-45 页)
更具体地说,我不明白
- 为什么选择应用测试的案例“高度选择”?假设您想知道一个区域内的人的平均身高是否小于 165 厘米,并决定进行测试。据我所知,标准程序是从该地区随机抽取样本并测量它们的高度。这怎么可能被高度选择?
- 假设案例是高度选择的,但这与显着性水平的选择有什么关系?再考虑上面的例子,如果你的抽样方法(我想是费舍尔所说的选择条件)是有偏差的,并且以某种方式有利于高个子,那么整个研究就毁了,显着性水平的主观确定也无法挽救它。
- 实际上,我什至不知道“特定试验表明的实际意义水平”指的是什么。是不是-那个实验的值,一些预设值,比如(in)着名的 0.05,还是别的什么?