我将使用基于模型的分析与稳健的标准误差进行区分,将后者称为“GEE”,这实际上是一个可交换的定义。除了 Scortchi 的精彩解释:
GEE 在小样本(即 10-50 名受试者)中可能存在“偏差”:(Lipsitz、Laird 和 Harrington,1990;Emrich 和 Piedmonte,1992;Sharples 和 Breslow,1992;Lipsitz 等人,1994;Qu、Piedmonte 和Williams,1994 年;Gunsolley、Getchell 和 Chinchilli,1995 年;Sherman 和 le Cessie,1997 年。)当我说 GEE 有偏差时,我的意思是,由于细胞计数小或为零,标准误差估计可能是保守的或反保守的,取决于哪些拟合值表现出这种行为以及它们与回归模型的整体趋势的一致性程度。
通常,当正确指定参数模型时,您仍然可以从基于模型的 CI 中获得正确的标准误差估计,但使用 GEE 的全部意义在于适应那个非常大的“如果”。GEE 允许统计学家仅仅为数据指定一个工作概率模型,并且参数(而不是在严格的参数框架中解释)被认为是一种“筛子”,它可以生成可重现的值,而不管底层的未知数据如何生成机制。这是半参数分析的核心和灵魂,GEE 就是一个例子。
GEE 还处理数据中未测量的协变源,即使指定了独立的相关矩阵。这是因为使用了经验而不是基于模型的协方差矩阵。例如,在 Poisson 建模中,您可能对从各种河流中采样的鲑鱼的生育率感兴趣。从雌鱼身上收获的卵子可能具有潜在的泊松分布,但由共享遗传性和特定溪流中可用资源组成的遗传变异可能使这些溪流中的鱼比其他溪流中的鱼更相似。只要抽样率与其人口比例一致(或以其他方式分层),GEE 将给出正确的人口标准误差估计。