t 检验的错误实施

机器算法验证 假设检验 t检验
2022-04-05 02:49:29

我刚刚收到了几天前对统计方法进行评估的结果,对于其中一个问题,我得到的结果是 t 检验执行不正确。反馈很模糊,我只是想尝试了解我做错了什么。

所以问题是:我有一个随机选择的人的数据集β- 提供锻炼前、锻炼后以及锻炼前和锻炼后水平之间的差异测量的内啡肽水平。我需要检验这个假设β- 内啡肽水平随着运动而增加,置信水平为 95%。

我做了什么:对于我的 t 检验,我决定使用锻炼后水平的数据。我的想法是计算锻炼后水平的平均值,然后进行 t 检验以将其与锻炼前数据的分布进行比较。我的想法是,如果我发现锻炼后平均值极不可能(在置信水平内)来自与锻炼前数据相同的分布,那么我可以得出结论,确实存在变化。此外,由于问题是测试是否β- 内啡肽水平随着运动而增加,我决定进行单边 t 检验,另一种假设是锻炼前的平均值小于锻炼后的平均值。

标记评论的内容:他或她写道,我必须使用锻炼前后水平差异的数据进行测试,并使用μ=0.

我实际上已经考虑过以标记认为正确的方式进行操作,但在我的脑海中,我认为这两种方法非常相似。谁能解释我在这里做错了什么?

1个回答

你错过了配对。您的观察不是独立的,因为它们来自相同的主题,只是在不同的时间。采用配对差异并测试这些差异是正确的方法。当您进行配对时,会有更大的力量(拒绝错误空值的能力)。