非配对重复测量数据

机器算法验证 重复测量
2022-03-16 08:45:29

我意识到这是“不要从这里开始”类型的问题之一,我确实告诉他们不要“从这里开始”,但是将数据丢弃是一种耻辱。

基本上我有一些区间正态数据,李克特量表类型的东西,来自两组,在时间一和时间二,我知道时间二的一些主题与时间一的相同,所以数据真的应该配对。然而,数据是匿名收集的,所以我们只有两组进行比较。

我最好的想法是我可以报告一个非常保守的差异估计,然后说“对于数据收集的所有问题,这可能是最小的影响”。

编辑:添加-

如果意义也是可能的,即“我有理由相信这种影响是非零的”,那么很好。

我什至不知道从哪里开始寻找这种分析数据的愚蠢方法。bootstrap 会有用吗?

任何建议都非常感谢,正如我所说的高度保守的建议,我认为会很好。

1个回答

一个简单的两样本 t 检验实际上是这里测试时差的保守方法。

假设是您从数据的配对 t 检验中获得的 t 统计量,如果您知道配对,而是您从简单的两组获得的 t 统计量对数据进行 t 检验。这两个 t 统计量具有以下关系: 其中是时间 1 得分和时间 2 得分之间的相关性,你无法估计,因为您不知道数据中的配对。tpairedtunpaired

tpaired=tunpaired1r
r

tpaired=tunpaired当且仅当时。但请注意,这也正是取其最小值的条件。随着的增加,相比变得越来越大r=0tpaired1rtpairedtunpaired

因此,如果您只报告两样本 t 检验,基本上假设的下限如果根据双样本 t 检验有显着差异,那么如果可以计算,配对 t 检验肯定也会显示出显着差异。但是,如果根据双样本 t 检验没有显着差异,如果您可以计算配对 t 检验,差异仍然可能是显着的。r=0tpaired


1从技术上讲,理论上,可以低至 -1,这实际上是函数在范围内的最小值。而当时,配对检验实际上不如非配对检验强大。然而,在现实生活中,time1 和 time2 分数不太可能(没有关于特定上下文的进一步信息)具有负相关性。相关性甚至不可能为 0。很可能存在适度的正相关性。rrr<0tt