使用 Stan 和前端包rstanarm
,或者brms
我可以像以前使用混合模型(例如lme
. 虽然我的办公桌上有 Kruschke-Gelman-Wagenmakers 等的大部分书籍和文章,但这些并没有告诉我如何为医学观众总结结果,在贝叶斯愤怒的 Skylla 和医学评论家的 Charybdis 之间徘徊( “我们想要意义,而不是那些分散的东西”)。
一个例子:胃频率(1/min)分三组测量;健康对照是参考。每个参与者都有几个测量值,所以我使用了以下混合模型lme
:
summary(lme(freq_min~ group, random = ~1|study_id, data = mo))
稍微编辑的结果:
Fixed effects: freq_min ~ group
Value Std.Error DF t-value p-value
(Intercept) 2.712 0.0804 70 33.7 0.0000
groupno_symptoms 0.353 0.1180 27 3.0 0.0058
groupwith_symptoms 0.195 0.1174 27 1.7 0.1086
为简单起见,我将使用 2* 标准误差作为 95% CI。
在常客的背景下,我将其总结为:
- 在对照组中,估计频率为 2.7/min(可能在此处添加 CI,但我有时会避免这样做,因为绝对 CI 和差异 CI 会造成混淆)。
- 在 no_symptoms 组中,频率比对照组高 0.4/min,CI(0.11 至 0.59)/min,p = 0.006。
- 在 with_symptoms 组中,频率比对照组高 0.2/min,CI(-0.04 到 0.4)/min,p = 0.11。
这大约是医学出版物可接受的最大复杂性,审稿人可能会要求我在第二种情况下添加“不显着”。
这与stan_lmer
默认先验相同。
freq_stan = stan_lmer(freq_min~ group + (1|study_id), data = mo)
contrast lower_CredI frequency upper_CredI
(Intercept) 2.58322 2.714 2.846
groupno_symptoms 0.15579 0.346 0.535
groupwith_symptoms -0.00382 0.188 0.384
其中 CredI 是 90% 的可信区间(请参阅 rstanarm vignette 为什么使用 90% 作为默认值。)
问题:
- 如何将上述总结转化为贝叶斯世界?
- 在多大程度上需要事先讨论?我很确定当我提到先验时,这篇论文会带着通常的“主观假设”回来。或者至少“请不要进行技术讨论”。但是所有贝叶斯权威都要求解释仅在先验的情况下有效。
- 在不背叛贝叶斯概念的情况下,我如何在公式中提供一些“意义”替代?像“令人难以置信的不同”(uuuh ...)或几乎令人难以置信的不同(buoha ...,听起来像“在意义的边缘)。
乔纳·加布里和本·古德里奇 (2016)。rstanarm:通过 Stan 进行的贝叶斯应用回归建模。R 包版本 2.9.0-3。 https://CRAN.R-project.org/package=rstanarm
斯坦开发团队(2015 年)。Stan:用于概率和采样的 C++ 库,版本 2.8.0。网址http://mc-stan.org/。
保罗-克里斯蒂安·布尔克纳 (2016)。brms:使用 Stan 的贝叶斯回归模型。R 包版本 0.8.0。https://CRAN.R-project.org/package=brms
Pinheiro J、Bates D、DebRoy S、Sarkar D 和 R 核心团队(2016 年)。nlme:线性和非线性混合效应模型。R 包版本 3.1-124,http://CRAN.R-project.org/package=nlme>。