在不知道真实总体均值的情况下如何计算 t 分数?

机器算法验证 自习 推理 标准错误
2022-03-29 01:48:58

我现在正在学习t分数。据我了解,当我们不知道真实的总体参数(例如:标准差和总体均值)并且不能使用 z-scores 时,使用 t-scores。这是书籍和互联网上用于计算 t 分数的公式:

t=X¯μSn

据我所知μ,用于定义真实的总体均值。所以在上面的公式中,我需要真实的总体平均值μ来计算 t 分数。但正如我之前在计算 t-score 时所说,我们不知道真实的总体参数,在这种情况下是真实的总体均值μ那么我应该使用什么数字μ以及如何计算呢?

另外为了清楚起见,如果您提供实际 t-score 计算的示例,这将非常有帮助。

2个回答

据我所知, μ 用于定义真实的总体均值。

不完全是,这就是问题所在。μ代表真实均值。它是由这一点统计推断是分析的问题定义的,而不是由数据本身定义的(这将使它成为估计,而不是假设)

所以在上面的公式中,我需要真实的总体平均值 μ 来计算 t 分数。

你需要一个关于它是什么的假设,即:它的可能你不需要知道那个值到底是什么。

但正如我之前在计算 t-score 时所说,我们不知道真实的总体参数,在这种情况下,真实的总体均值 μ。那么我应该在 μ 中使用什么数字以及如何计算呢?

一个例子,做了几个方法

假设您要求一组受试者估计某物的价格——具体来说,比如说一本新的大学教科书——你对他们是否高估或低估了真实价格感兴趣。

在这里你可以查到真实的价格,所以如果是 45 美元,而且猜测的价格也是美元,那么 μ=45。如果受试者的平均猜测是 60,那么您的 t 检验是测试是否有足够的证据表明他们系统地高估了价格,或者他们的猜测是否可能来自既不低估也不高估教科书价格的受试者群体。

以另一种完全等效的方式来看,您可能会从每个主题的猜测中减去真实价格。然后您正在查看与正确价格的偏差,并且测试将设置 μ=0(无偏价格猜测)

从第三种方式来看,您可能会考虑对 μ 的所有值运行此测试(您不会真的这样做,但请耐心等待)。对于接近受试者平均值的 μs,测试将“不拒绝”,但对于远离受试者平均值的 μs,测试拒绝数据来自具有该 μ 值的分布。测试不拒绝的 μ 值区域在某种意义上是根据数据“合理”的 μ 值区域。这是激发(有时实际上是构建)置信区间的想法的一种方法。当置信区间(非拒绝 μs 的区域)不重叠 45(或在第二个公式中为零)时,

这些方法中的每一种都以不同的方式将您带到同一个地方。它们都不需要知道 μ 的真实值。在您的情况下,前两个是要考虑的。

两种不同的μ这里涉及:

  1. 您在 t 统计量的分子中使用的假设均值进行 t 检验(有时表示为μ0), 和
  2. 真实人口均值,μ.

t检验实际上是看真实总体均值是否与假设均值不同——也就是说,它是对原假设的检验H0:μ=μ0.

不要混淆μμ0. 两者中只有一个是已知的。