我正在使用具有一个固定效应(条件)和两个随机效应(参与者由于主题设计和配对)的混合效应模型分析数据集。该模型是使用lme4
包生成的:exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp)
.
接下来,我对没有固定效应(条件)的模型进行了该模型的似然比检验,并有显着差异。我的数据集中有 3 个条件,所以我想进行多重比较,但我不确定使用哪种方法。我在 CrossValidated 和其他论坛上发现了许多类似的问题,但我仍然很困惑。
据我所见,人们建议使用
1.包lsmeans
-lsmeans(exp.model,pairwise~condition)
它给了我以下输出:
condition lsmean SE df lower.CL upper.CL
Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089
Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443
Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552
Confidence level used: 0.95
$contrasts
contrast estimate SE df t.ratio p.value
Condition1 - Condition2 -0.04893538 0.03813262 62.07 -1.283 0.4099
Condition1 - Condition3 -0.10424628 0.03813262 62.07 -2.734 0.0219
Condition2 - Condition3 -0.05531090 0.03813262 62.07 -1.450 0.3217
P value adjustment: tukey method for comparing a family of 3 estimates
2.包的multcomp
两种不同方式——使用mcp
glht(exp.model,mcp(condition="Tukey"))
导致
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Tukey Contrasts
Fit: lmer(formula = outcome ~ condition + (1 | participant) + (1 | pair),
data = exp, REML = FALSE)
Linear Hypotheses:
Estimate Std. Error z value Pr(>|z|)
Condition2 - Condition1 == 0 0.04894 0.03749 1.305 0.392
Condition3 - Condition1 == 0 0.10425 0.03749 2.781 0.015 *
Condition3 - Condition2 == 0 0.05531 0.03749 1.475 0.303
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Adjusted p values reported -- single-step method)
并使用lsm
glht(exp.model,lsm(pairwise~condition))
导致
Note: df set to 62
Simultaneous Tests for General Linear Hypotheses
Fit: lmer(formula = outcome ~ condition + (1 | participant) + (1 | pair),
data = exp, REML = FALSE)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
Condition1 - Condition2 == 0 -0.04894 0.03749 -1.305 0.3977
Condition1 - Condition3 == 0 -0.10425 0.03749 -2.781 0.0195 *
Condition2 - Condition3 == 0 -0.05531 0.03749 -1.475 0.3098
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Adjusted p values reported -- single-step method)
如您所见,这些方法给出了不同的结果。这是我第一次使用 R 和 stats,所以可能出了点问题,但我不知道在哪里。我的问题是:
提出的方法之间有什么区别?我在一个相关问题的答案中读到它是关于自由度(lsmeans
vs. glht
)的。
是否有一些规则或建议何时使用哪一种,即方法 1 适合这种类型的数据集/模型等? 我应该报告哪个结果?在不知道更好的情况下,我可能只是去报告我得到的最高 p 值以确保安全,但如果有更好的理由会很好。谢谢