一个值显着远离总体均值的统计检验:它是 Z 检验还是 T 检验?

机器算法验证 假设检验 统计学意义
2022-03-04 05:41:39

与值列表相比,一个值有多重要?在大多数情况下,统计测试涉及将样本集与总体进行比较。在我的例子中,样本是由一个值组成的,我们将它与总体进行比较。

我是统计假设检验的业余爱好者,面临着可能是最基本的问题。这不仅仅是一项测试,而是数百项测试。我有一个参数空间,并且必须对每个点进行显着性检验。为每个参数组合生成值和背景列表(总体)。然后我按 p 值排序并找到有趣的参数组合。事实上,找到这个 p-val 高(不显着)的参数组合也很重要。

因此,让我们进行一次测试:我有一个从选定集生成的计算值和一个通过选择随机训练集计算的背景值集。计算值为 0.35,背景集(可能?)正态分布,平均值为 0.25,标准值非常窄(e-7)。我实际上对分布一无所知,因为样本是从其他东西计算出来的,它们不是来自某个分布的随机数样本,所以背景是正确的词。

零假设是“样本测试的平均值等于我的计算值,即 0.35”。我什么时候应该将其视为 Z 检验或 T 检验?我希望该值显着高于总体平均值,因此它是一个单尾检验。

我对将什么视为样本感到有些困惑:我要么有一个样本(观察),而背景列表作为总体,要么我的样本是背景列表,我将其与整体(未抽样)进行比较根据原假设应该具有相同均值的总体。一旦决定了这一点,我猜测试就会走向不同的方向。

如果是 T 检验,我如何计算它的 p 值?我想自己计算它而不是使用 R/Python/Excel 函数(我已经知道如何做到这一点),因此我必须首先建立正确的公式。

首先,我怀疑 T 检验有点过于笼统,因为在我的情况下,T 检验将与样本量相关联并且具有以下形式:

T=Z/s,
在哪里
Z=X¯σn
和 s 是
s=σ^/σ
,样本标准与总体标准。所以我有两种情况:要么我的样本量是人口的规模,我“猜”这意味着我正在处理 Z 检验,或者人口统计数据(n 和 std)是未知的,但分布可以在某种方式近似,我真的在处理 T 检验。无论如何,我的以下问题是:

  1. 如何计算 p 值?(即不使用 R/Python/Excel 函数或 p 值表查找,而是根据公式实际计算它,因为我想知道我在做什么)
  2. 如何根据样本量确定显着性阈值?(一个公式会很好)
2个回答

你提出了一个有趣的问题。首先,如果您有 0.35 的观察值、0.25 的平均值和 1/10^7 的标准差(这就是我解释您的 e^-7 位的方式),那么您真的不需要进行任何假设测试练习。您的 0.35 观察值与 0.25 的平均值非常不同,因为它将与平均值相差数千个标准差,并且可能与平均值相差数百万个标准误差。

Z检验和t检验的区别主要是样本量。对于小于 120 的样本,您应该使用 t 检验来计算 p 值。当样本量大于这个值时,如果你使用哪一个,它并没有太大的区别。无论样本大小如何,都可以通过两种方式进行计算,并观察两个测试之间的差异有多大,这很有趣。

至于自己计算,您可以通过将观察值与平均值之间的差异除以标准误差来计算 t stat。标准误差是标准偏差除以样本量的平方根。现在,你有了你的 t 统计数据。要计算 ap 值,我认为除了在测试表中查找您的 t 值之外别无选择。如果您接受一个简单的 Excel 替代 TDIST(t stat value, DF, 1 or 2 for 1 or 2 tail p value) 就可以了。要使用 Z 计算 ap 值,1 尾检验的 Excel 公式为:(1 - NORMSDIST (Z 值)。Z 值与 t stat 相同(或远离平均值的标准误差数)。

需要注意的是,这些假设检验方法可能会因样本量而失真。换句话说,样本量越大,标准误差越小,得到的 Z 值或 t stat 越高,p 值越低,统计显着性越高。作为这个逻辑的捷径,大样本量将导致高统计显着性。但是,与大样本量相关的高统计显着性可能完全无关紧要。换句话说,统计显着性是一个数学短语。它不一定意味着重要(根据韦氏词典)。

为了摆脱这个大样本量的陷阱,统计学家已经转向效应量方法。后者使用标准偏差而不是标准误差作为两个观测值之间的统计距离单位。使用这样的框架样本量将不会影响您的统计显着性。使用效果大小也会使您远离 p 值并转向置信区间,这在简单的英语中可能更有意义。

假设检验总是指总体。如果你想对样本做一个陈述,你不需要测试(只是比较你看到的)。频率论者相信渐近论,因此只要您的样本量很大,就不必担心数据的分布。Z-test 和 T-test 在计算检验统计量方面基本相同,只是临界值是从不同的分布(Normal vs Student-T)获得的。如果您的样本量很大,则差异很小。

关于 Q1:只需从具有 n-1 个自由度的 T 分布中查找它,其中 n 是样本大小。

关于 Q2:您根据 Z 检验所需的显着性水平以及 T 检验的样本量显着性水平来计算阈值。