我应该使用什么统计测试来查看二进制结果随时间的变化?

机器算法验证 重复测量 面板数据
2022-04-08 10:33:13

我正在设计一项研究,研究 HIV+ 母亲在产后 6 周和 6 个月时的服药依从性。依从性测量是二元的(1= 依从,0= 不依从)所以我最终会得到 4 个潜在结果:Y=11、Y=10、Y=01 和 Y=00。我想测量每组中女性的比例,看看她们在统计上是否存在显着差异。在这种情况下我应该使用什么统计测试?

此外,我正在研究不同的因素以及它们如何影响依从性。例如,交付地点(设施或家庭)是否与依从性有关?我应该使用什么模型来查看这些效果?

2个回答

适用于您的情况的两种方法是:

  1. 广义估计方程(GEE),正如您在上面的评论中指出的那样。这绝对有效。
  2. 广义线性混合模型 (GLMM)当然,您会想要选择 logit 链接。

使用上述方法,您可以轻松地将希望研究的解释变量合并到模型中。我不推荐生存型分析,因为您只有两个时间点,因为没有包含太多时间信息。

至于对结果进行编码,您可以按照正常方式进行,即如果遵守,则 y=1,如果不遵守,则 y=0。您将在 6 周或 6 个月时有两个级别的时间因素来处理相关的结果测量。也就是说,有两个观察与每个主题 ID 相关联。

如果您的意思是您在 6w 和 6mt 进行访问,那么您可能能够确定患者停止服药的确切日期,这意味着最好的方法是生存分析,不依从性为“失败”事件。除了显示 Kaplan-Meier 曲线外,您还可以使用 Cox 回归模型来评估其他变量对结果的影响。如果您有随时间变化的协变量,例如就业,您可以对它们进行建模。

另一方面,如果您只有 6w 和 6mt 的 2 个时间点,您可以在每个时间点使用逻辑回归模型,将不依从性作为结果变量,将测量的“风险因素”作为解释变量。