我需要在方差列表中获得某种“平均值”,但无法提出合理的解决方案。在这个线程中有一个关于毕达哥拉斯三种方法(算术、几何和谐波)之间差异的有趣讨论;但是,我仍然认为他们中的任何一个都不是一个好的候选人。有什么建议么?
PS 一些上下文 - 这些方差是来自受试者的样本方差,每个受试者都经历了相同的实验设计,样本量大致相同。换句话说,有抽样方差 , , ...,,对应于这主题。已经在人群层面进行了荟萃分析。我需要获得某种“平均”或“汇总”样本方差的原因是我想在元分析后用它来计算诸如ICC之类的指标。
PPS 为了使讨论更具体,让我用 R 中的以下示例来解释这个问题:
library(metafor)
dat <- get(data(dat.konstantopoulos2011))
dat$district <- as.factor(dat$district)
dat$school <- as.factor(dat$school)
在数据集中,每所学校的表现得分存在差异:
str(dat)
Classes ‘escalc’ and 'data.frame': 56 obs. of 6 variables:
$ district: Factor w/ 11 levels "11","12","18",..: 1 1 1 1 2 2 2 2 3 3 ...
$ school : Factor w/ 11 levels "1","2","3","4",..: 1 2 3 4 1 2 3 4 1 2 ...
$ year : int 1976 1976 1976 1976 1989 1989 1989 1989 1994 1994 ...
$ yi : atomic -0.18 -0.22 0.23 -0.3 0.13 -0.26 0.19 0.32 0.45 0.38 ...
$ vi : num 0.118 0.118 0.144 0.144 0.014 0.014 0.015 0.024 0.023 0.043 ...
假设我们使用分层或混合效应模型执行元分析:
其中,和个学校和个学区的随机效应是已知高斯分布的测量误差。这个模型可以分析如下:
(fm <- rma.mv(yi, vi, random = list(~1 | district, ~1 | school), data=dat))
为两个方差分量呈现以下方差估计:
Multivariate Meta-Analysis Model (k = 56; method: REML)
Variance Components:
estim sqrt nlvls fixed factor
sigma^2.1 0.0814 0.2853 11 no district
sigma^2.2 0.0010 0.0308 11 no school
结果中的两个方差 sigma^2.1 和 sigma^2.2 对应于两个随机效应变量(地区和学校)。
我想计算地区的 ICC,这就是为什么我想首先获得测量项的汇总方差。由于总方差为
我最初的(也是简单的)方法是只使用算术平均值:
但我不确定算术平均值在这种情况下是否合适。