重叠样本 t 检验

机器算法验证 t检验 非独立的
2022-03-16 16:04:55

我有10个人一起工作。他们分组工作 6 天:第 1 周三天,第 2 周三天。在每一天,我没有完整的人,而是他们的一部分。在每一天,我都会衡量个人的表现。

我不得不说第 1 周或第 2 周的总体表现是否更高。
所以我打算对这样的两组进行 t 检验,例如:

第 1 组 – 第 1 周的表演

第 1 天:保罗、玛丽、约翰 第 2 天:保罗、莎拉 第 3 天:杰西卡、莎拉

第 2 组 – 第 2 周表演

第 4 天:保罗、丽塔 第 5 天:约翰、保罗、莎拉 第 6 天:杰西卡、丽塔

问题

  • 我可以将两组视为独立的并进行独立的 t 检验吗?
  • 您能否建议我最好的方式来说明第 1 周或第 2 周的总体表现是否更好?

我关心的是每天不同的人以及每天不同规模的工作组。我也很担心,因为我在不同的日子和两组都有相同的人。所以看起来样本是重叠的。

2个回答

您可以尝试使用回归。,响应,作为性能测量。然后你为这些人和几个星期制作假人。现在,这可能会给您带来比观察更多的变量,但也许可以挽救它,您可以尝试将 person 变量视为随机效应,将 week 视为固定效应。Yx

您在不同的日子多次测量每个人的表现,并将两组与每组中的相同人进行比较。因此,您应该将两组视为非独立的,因为一个人的表现很可能在不同的日子里会相互关联。

有几个选项可以检验您的假设。一些想法(假设满足要求):

  • 一种简单的方法是计算每个人的平均表现,分别为第 1 周和第 2 周。然后使用配对 t 检验比较这两个平均值。但是,这将忽略一些信息,例如工作组的大小或组成。
  • 另一种方法是重复测量方差分析,您可以在其中包括每天的表现,以及像组大小这样的协变量。然后你用对比来检验你的假设。工作组的组成仍然被忽略。
  • 如果您有理由相信绩效取决于工作组的组成,您可以创建一个多级/混合设计模型并将日期添加为随机效应。