关于假设检验,有两件事一直困扰着我:
- 总体平均值恰好是任何给定数字(假设所讨论的随机变量是连续的)的机会总是为零,不是吗?因此,我们应该始终拒绝原假设......
- 如果检验的结果是拒绝还是接受原假设,它与备择假设所陈述的内容有何不同?
拜托,任何人都可以阐明一些?
关于假设检验,有两件事一直困扰着我:
拜托,任何人都可以阐明一些?
在频率论假设检验中,谈论“总体均值是给定数字的机会”是没有意义的,因为总体均值是一个固定但未知的值。特别是,常客测试不假设总体均值是一个随机变量,因此谈论是没有意义的。
备择假设在选择关键区域时很重要,该关键区域是一组检验统计量的实现,这意味着拒绝零值以支持备择方案。例如,如果您将替代指定为,那么您将使用单尾测试而不是双尾测试。
你可以拒绝零假设,但你从不接受它,你只是没有拒绝它。也就是说,您可能会得出结论,证据(观察)不足以拒绝原假设,但您不接受原假设并接受它。
例如,在检验某种药物是否有效的临床试验中,零假设是该药物无效。如果有强有力的证据表明药物有效,则您拒绝无效。如果证据很弱,你说没有足够的证据来拒绝原假设。您没有声明药物无效(接受无效),只是没有足够的证据表明它有效(不要拒绝无效)。在点空的情况下,例如, 你可以自信地说如果证据指向那样,但在证据不足的情况下,精明的统计学家会说没有足够的证据可以得出结论 而不是向全世界宣告正如刚刚结束的测试所证明的那样。毕竟,实际价值 可能与
当费舍尔第一次设计现在所谓的假设检验时,他并没有想到替代假设。他只是想创建一个统计数据来衡量估计值和建议值之间的一致性程度。他发现,与从数据中得出的估计值相比,估计器的值更远离提议值的概率。p 值只是检验统计量的一对一转换。这里没有替代假设。
是 Neyman 和 Pearson 创造了零假设和备择假设公式并将其嵌入到决策理论中——我应该接受这些陈述中的哪一个?(我在这里使用“接受”有点松散。)他们想找到一个尽可能多地正确的程序(从而将这个概念与重复抽样的常客概念联系起来)。他们选择在拒绝真空值的给定机会(对于给定的第一类错误概率)下,最小化拒绝假空值的机会(最小化 II 类错误或最大化功效)。这个框架需要一个零假设的陈述来确定拒绝一个真正的零的机会(这是 p 值,与 Fisher 计算的相同)和备择假设的陈述,以找到在检测备择假设为真时最强大的程序。通常,对于给定的空值,我们找不到针对所有可能替代方案最强大的测试。重申,替代方案在选择测试时很重要。
因此,当您进行假设检验时,您确实会使用替代方案:它已融入您首先选择使用的测试中。
虽然通常只使用等号 () 事实上,原假设包含所有未包含在备择假设中的值,所以事实上如果我们有那么我们正在测试的 null 确实是. 即使是 2 尾检验零假设实际上也是平均值的真实值在声称的零值周围的一个小区间内,该区间由数据测量和记录中的舍入水平以及数据的精度决定电脑。