我有一个包含 100 列的数据集,分为 40 个普通列和 60 个 MI 列。每位患者的样本分别在两次就诊时采集,每个样本都有两次技术重复。
我该怎么做?我如何构建一个将这种设计考虑在内的模型,以检查正常患者和病例患者之间的显着差异?
我有一个包含 100 列的数据集,分为 40 个普通列和 60 个 MI 列。每位患者的样本分别在两次就诊时采集,每个样本都有两次技术重复。
我该怎么做?我如何构建一个将这种设计考虑在内的模型,以检查正常患者和病例患者之间的显着差异?
但是,此解决方案没有考虑每次访问或单独访问的两个重复。
正确的。
我该怎么做?
您需要考虑每位患者的重复就诊,以及每位患者每次就诊中的重复重复。这是因为同一患者的测量结果可能与其他患者的测量结果更相似,并且患者就诊的重复数据可能比同一患者其他就诊的重复数据更相似。
一种方法是使用混合效应模型,随机截取患者和访问。
为此,您需要将数据重新格式化为“长”格式,其中数据中的每一行对应一个测量值。因此,每个患者将有 4 行。然后,您将有列(变量)指示患者 ID、访问、重复 ID 和正常/MI 指标。像这样的东西:
PatientID VisitID ReplicateID MI Value
A 1 1 1 1.0
A 1 2 1 1.1
A 2 1 1 2.0
A 2 2 1 1.6
B 1 1 0 0.2
B 1 2 0 0.3
B 2 1 0 0.2
B 2 2 0 0.5
在 R 中,使用lme4包的语法,您将使用以下公式:
lmer(Value ~ MI + (1 | PatientID/VisitID), data = .... )
您的兴趣将集中在 的估计上MI,并且您应该检查模型残差是否近似正态分布。