我是一名学生,现在正在学习我的第一门统计学课程。我对“测试统计”一词感到困惑。
在下文中(我在一些教科书中看到了这一点),似乎是从特定样本计算的特定值。
但是,在下面(我在其他一些教科书中看到过),似乎是一个随机变量。
那么,术语“测试统计量”是指特定值还是随机变量,或两者兼而有之?
我是一名学生,现在正在学习我的第一门统计学课程。我对“测试统计”一词感到困惑。
在下文中(我在一些教科书中看到了这一点),似乎是从特定样本计算的特定值。
但是,在下面(我在其他一些教科书中看到过),似乎是一个随机变量。
那么,术语“测试统计量”是指特定值还是随机变量,或两者兼而有之?
简短的回答是“是”。
符号的传统是使用大写字母(上面的 T)表示随机变量,使用小写字母 (t) 表示计算或观察到的该随机变量的特定值。
T 是一个随机变量,因为它表示从随机选择的样本中计算的结果。一旦你取样(并且随机性结束),你就可以计算 t,具体值,并根据 t 如何与 T 的分布进行比较得出结论。
因此,当我们根据我们可以收集的所有不同样本考虑它可以采用的所有值时,测试统计量是一个随机变量。但是一旦我们收集了一个样本,我们就会计算出检验统计量的特定值。
检验统计量是用于做出关于零假设的决定的统计量。
统计量是一个已实现的值(例如 t):统计量是一个数值,可以说明样本的某些情况。由于统计数据用于估计总体参数的值,它们本身就是值。因为(足够长的)样本总是不同的,所以统计数据(关于样本的数字陈述)会有所不同。通过从特定人群中抽取的大量样本获得的统计量的概率分布称为其抽样分布——该统计量的分布,被视为随机变量。
统计量是随机变量(例如 T):统计量是数据的任何函数(从样本到样本不变)。数据由随机变量(一些合适的维度)描述。由于随机变量的任何函数本身都是随机变量,因此统计量也是随机变量。
几乎总是可以从上下文中清楚地看出它的含义是什么,尤其是在遵守大写/小写约定时。
检验统计量是特定于您观察到的数据的观察,它在给定假设下遵循概率分布。这个假设通常被称为。
例如,在您的样本中,检验统计量(称为 t 统计量)取决于观察到的数据(和都来自数据)。
的假设下,您计算的统计量将遵循某个分布。然后在假设下确定该统计值发生的概率。如果认为该值较低,则拒绝
如果我们拒绝假设,这并不意味着我们所做的假设可以保证是不正确的。如果它是真的并且我们因为在下检验统计量的概率低而拒绝了它,我们称之为I 类错误。
另一方面,如果我们接受这个假设,这并不意味着我们的假设肯定是正确的。如果假设不正确并且我们接受它,因为它在我们的错误假设下具有足够高的概率,这称为II 型错误。
统计数据是一个特定的值,只有当我们接受某些假设时,我们才能假设它遵循特定的概率分布。
此原则适用于所有测试统计量,而不仅仅是您在此处提到的 t 统计量。