这个问题是在咨询环境中提出的,我对你的想法很感兴趣。
语境
在 SPSS 语言中,在计算尺度平均值时处理偶尔丢失数据的一种策略如下所示:
COMPUTE depmean = mean.4(dep1, dep2, dep3, dep4, dep5, dep6).
EXECUTE.
即,通过取六个项目的平均值来计算抑郁症等心理量表的平均值。如果参与者有四个或更多非缺失项,则返回非缺失项的平均值。如果参与者有三个或更少的非缺失项目,则返回缺失。
当然,量表中的项目数和用于计算平均值的阈值项目数可能会有所不同。
问题
- 一般来说,在什么情况下,您认为这种处理缺失数据的方法是合适的?
- 如果您认为它不合适,您会推荐什么替代程序?