据我所知, μ 用于定义真实的总体均值。
不完全是,这就是问题所在。μ代表真实均值。它是由这一点统计推断是分析的问题定义的,而不是由数据本身定义的(这将使它成为估计,而不是假设)
所以在上面的公式中,我需要真实的总体平均值 μ 来计算 t 分数。
你需要一个关于它是什么的假设,即:它的可能值。你不需要知道那个值到底是什么。
但正如我之前在计算 t-score 时所说,我们不知道真实的总体参数,在这种情况下,真实的总体均值 μ。那么我应该在 μ 中使用什么数字以及如何计算呢?
一个例子,做了几个方法
假设您要求一组受试者估计某物的价格——具体来说,比如说一本新的大学教科书——你对他们是否高估或低估了真实价格感兴趣。
在这里你可以查到真实的价格,所以如果是 45 美元,而且猜测的价格也是美元,那么 μ=45。如果受试者的平均猜测是 60,那么您的 t 检验是测试是否有足够的证据表明他们系统地高估了价格,或者他们的猜测是否可能来自既不低估也不高估教科书价格的受试者群体。
以另一种完全等效的方式来看,您可能会从每个主题的猜测中减去真实价格。然后您正在查看与正确价格的偏差,并且测试将设置 μ=0(无偏价格猜测)
从第三种方式来看,您可能会考虑对 μ 的所有值运行此测试(您不会真的这样做,但请耐心等待)。对于接近受试者平均值的 μs,测试将“不拒绝”,但对于远离受试者平均值的 μs,测试将拒绝数据来自具有该 μ 值的分布。测试不拒绝的 μ 值区域在某种意义上是根据数据“合理”的 μ 值区域。这是激发(有时实际上是构建)置信区间的想法的一种方法。当置信区间(非拒绝 μs 的区域)不重叠 45(或在第二个公式中为零)时,
这些方法中的每一种都以不同的方式将您带到同一个地方。它们都不需要知道 μ 的真实值。在您的情况下,前两个是要考虑的。