在一名评估者的数据缺失的情况下,基于两名评估者获得平均测量值

机器算法验证 spss 缺失数据 数据插补
2022-03-25 20:54:42

语境:

我正在调查一项涉及儿童的临床研究中的行为。我让父母和老师都完成了问卷调查,以了解对相同基本结构的理解,例如反应性攻击。

在数据收集结束时,我有所有案例的家长数据,n=55,以及 41 个案例的教师数据 - 因此,我有 14 个案例,我只有家长数据。

出于我们研究的目的,汇总家长和教师对每个案例的观察是有意义的。由于我有一个小样本,并且每个案例都有父数据,因此以成对方式删除案例似乎不是一个可行的选择。有几个变量我需要这样做,所有这些似乎都很好地相关。在聚合数据之前,我认为解决丢失数据问题是有意义的。

关于“替换”,我已经做了一些简短的阅读,并且熟悉基本的“变量内”替换选项,但是,我认为可能有一种更强大的方法可供我使用:

(a) 我们在每个案例中对每个变量的父分数,n=55,100% 的案例。

(b) 我们对父母和老师分数之间关系的理解在我们都有的情况下,n=41,74.5% 的情况

问题:

  • 上面概述的总体思路是否合理?
  • 什么是详细实现它的好算法?
  • 它如何在 SPSS 中实现?
1个回答

上面的想法听起来很像单一插补。当面对缺失数据时,这比逐个列表或逐对删除更好。但是,它仍然不是一个好方法。

更好的方法可能是多重插补。本质上,您可以根据观察到的数据从 3-10 个数据集进行模拟。然后,您对每个数据集执行所有分析,并在最后合并结果。模拟多个数据集的目的是确保考虑到插补过程中的不确定性。

这可以使用 SPSS 中的多重插补程序来完成(我相信它在分析菜单上)。

然而,虽然多重插补已被证明对大型数据集有效,但关于其在小样本中的使用的信息并不多。

可以在这里找到一个很好的介绍(从教育的角度来看)

可以在此处找到有关其在小样本中的使用(在纵向背景下)的论文