统计数据可以依赖于参数吗?

机器算法验证 数理统计 定义
2022-04-15 15:32:39

统计数据可以依赖于参数吗?

根据定义,统计量是一个依赖于从总体中获取的 rv 的函数。在伯杰的“统计推断”中,在紧接在统计定义下方的段落中,指出统计不能依赖于参数。在 wiki 中,它是未知参数。T(X)

但是,t 统计量不依赖于参数吗?

2个回答

根据定义,统计量不能是未知参数的函数。检验的情况下,我们的检验统计量采用以下形式t

n(x¯μ0)s

其中是未知均值的假设值也就是说,统计量是数据和我们碰巧正在测试的特定假设(当然是已知的)的函数,而不是任何未知参数的函数。μ0t

检验统计量是可观察随机变量的函数,其分布不依赖于任何未知参数。例如,如果 n 足够大,则中心极限定理表明,均值为零且方差为 1 的正态分布对检验统计量近似有效: 显然检验统计量涉及未知参数。通常,此设置中的推理问题是测试总体平均值是否等于某个值,例如,其中是已知的(测试将决定它是否真的是) . 标准误差,

T=X¯nμσ/n,
μμ0μ0μ0σ, 必须估计。但是,检验统计量的零分布是 N(0,1),重要的是,它没有任何未知参数。

许多作者认为显着性检验与假设检验相同,这可能会导致对这一点的混淆。在假设检验中,检验的大小是先验确定的,这意味着检验统计量的分布必须是先验可估计的,因此不能有任何未知参数。也就是说,在获取数据和估计之前,测试的大小应该是可计算的。在这里,测试的大小是犯第一类错误的概率。更准确地说,它是原假设下检验功效的上限值;其中幂是在给定参数下拒绝原假设的概率。X¯nse(X¯n)=σ/n

在显着性检验中,p 值是后验确定的。p 值是基于零分布观察到的检验统计量“至少与观察到的统计量一样大”的概率。它不打算用于假设检验设置。这样做的一个问题(例如,如果 p 值 < alpha,则拒绝原假设)是有不同的方法来计算 p 值,这可能会根据测试类型和所进行的实验而改变结果。参见 Goodman (1999, Ann Intern Med, vol. 130, pp. 995 - 1004),对两种测试程序之间的差异进行了很好的讨论。此外,请参阅 ASA 关于 p 值的声明(2016,https://doi.org/10.1080/00031305.2016.1154108)。

在 p 值/显着性检验设置中,样本统计量可能并不重要(即是样本统计量,因为它是可观察随机变量的函数)具有不包含未知参数,因为它是在没有控制测试大小的情况下观察数据后计算的。X¯n

总之,像这样的统计量是一个样本统计量。严格来说,它不是一个检验统计量,因为它的分布,比如,取决于未知参数。假设的大小和力量不能用这些令人讨厌的参数先验地调节。但是,认为这两种测试类型相同的作者可能不担心控制测试的大小。在他们的设置中,样本统计量与检验统计量相同。统计量是一个检验统计量,因为它的分布不依赖于未知参数,它们是零和一,分别。X¯nN(μ,σ2)(X¯nμ)/se(X¯n)N(0,1)