混合效应、医生和操作:预测包含以前未观察到的水平的新数据,并相应地更新我们的信心

机器算法验证 贝叶斯 混合模式 多层次分析 随机效应模型 分层贝叶斯
2022-04-14 09:29:55

这是一个假设情况的快速草图。有医生{1,,J} 谁执行不同类型的操作{1,,K}. 我们的响应变量是操作是否成功(Yi,j,k=1这意味着对于i医生的第一个病人j他为此进行了手术k是成功的)。

医生有一定的技能水平αj,并且操作具有一定的固有难度βk. 我们可能认为有一些固定的已知数量的手术,但医生的技能是正态分布的,来自一群医生。所以我们假设医生技能分布为αjN(0,σα2).

一个粗略的模型可能如下所示,其中成功概率的 Logit 是一些基本截距、医生的技能和操作难度的总和。

Logit(Pr(Yi,j,k=1))=μ0+αj+βk.

这个朴素的模型似乎是一个简单的混合效应模型。医生是我们从一些更大的人群中观察到的水平,他们的技能是随机截取的。操作可以是分类固定效果(确定难度)。实际上,我们当然希望Doctor 和Operation 之间存在互动(他们是专长的!),但我暂时忽略这一点,因为我只是想理解一个理论示例。

这是问题的症结所在。我想要一个近似模型(这不需要非常严格),它可以查看一批新数据并猜测“我们预计有多少失败的操作?”。这是所涉及的医生的技能、他们做了多少手术以及这些手术是什么的某种功能。然而,在实践中,我的新一批数据将包含我非常了解的医生,以及刚从医学院毕业的新员工!(谁缺乏以前的数据来表明他们的技能)。

在这种情况下,混合效应模型是否仍然有效?基本上,我想要一个模型,当我们在实践中没有观察到这个医生时,它默认为某种技能的基线假设,然后随着我们观察的更多而更新它(直到我们非常有信心,如果我们有一个大样本) . 这显然是一个贝叶斯框架:我们对他们的技能有一些先验信念,我们对其进行更新以反映新信息。

举个具体的例子,我们的新数据包含医生 A、B 和 C 的手术。A 医生是一位已经进行了 5000 次手术的老手,我们可以自信地估计他们的技能比一般人高得多,因为他们很少失败。B 医生刚从另一家医院搬来,所以我们假设他们和普通医生一样熟练。C 医生进行了 100 次手术,失败率比平时高,所以我们认为他们的技能较低,但认识到这是一个小样本,所以我们对冲一下赌注。同样,这显然是贝叶斯设置,但我不确定是否可以使用混合效果模型来完成,或者如何实际构建合理的贝叶斯模型来反映这一点。

所以,总的来说,

  • 混合效应模型可以在这里工作吗?(也就是说,根据我们对这个特定随机截距看到的过​​去数据更新其对医生技能的信心)。
  • 我应该转向更直接的贝叶斯框架吗?(我确信混合效应模型具有贝叶斯解释,但我再次不确定它是否专门满足我的需要)。
  • 你对模型有什么想法可以做我需要的吗?这意味着一个粗略的基准,而不是一个精英预测模型,即使它不完全适合场景(医生和手术只是一个例子),它也很简单和直观。

感谢大家提供的任何建议!

2个回答

您所描述的是混合模型的动态预测的概念。

最初,当您没有医生的信息时,您仅使用预测中的固定效应,即,您将他/她的能力水平设为平均值(αj=0)。

但是,由于记录了额外的信息,您可以通过计算医生的随机效应来更新您的预测。你可以从随机效应的后验/条件分布中得到这个αj给定观察到的数据yj.

您可以在GLMMadaptive包的动态预测插图中找到有关这些预测的更多信息。

我认为贝叶斯方法可能是有益的。在贝叶斯混合模型中预测未观察到的类别时,您可以通过对αj从装的N(0,σα2)(除了从拟合的后验中采样固定效果)。这样,您将看到新医生的高度不确定性 - 恕我直言,这是一件好事。不确定性的大小将与拟合的σα2,因此当大多数医生相似时,您将获得较低的不确定性。在获得更多数据后,您将重新拟合模型,(现在观察到的)医生的不确定性将逐渐缩小。