这是一个假设情况的快速草图。有医生 谁执行不同类型的操作. 我们的响应变量是操作是否成功(这意味着对于医生的第一个病人他为此进行了手术是成功的)。
医生有一定的技能水平,并且操作具有一定的固有难度. 我们可能认为有一些固定的已知数量的手术,但医生的技能是正态分布的,来自一群医生。所以我们假设医生技能分布为.
一个粗略的模型可能如下所示,其中成功概率的 Logit 是一些基本截距、医生的技能和操作难度的总和。
这个朴素的模型似乎是一个简单的混合效应模型。医生是我们从一些更大的人群中观察到的水平,他们的技能是随机截取的。操作可以是分类固定效果(确定难度)。实际上,我们当然希望Doctor 和Operation 之间存在互动(他们是专长的!),但我暂时忽略这一点,因为我只是想理解一个理论示例。
这是问题的症结所在。我想要一个近似模型(这不需要非常严格),它可以查看一批新数据并猜测“我们预计有多少失败的操作?”。这是所涉及的医生的技能、他们做了多少手术以及这些手术是什么的某种功能。然而,在实践中,我的新一批数据将包含我非常了解的医生,以及刚从医学院毕业的新员工!(谁缺乏以前的数据来表明他们的技能)。
在这种情况下,混合效应模型是否仍然有效?基本上,我想要一个模型,当我们在实践中没有观察到这个医生时,它默认为某种技能的基线假设,然后随着我们观察的更多而更新它(直到我们非常有信心,如果我们有一个大样本) . 这显然是一个贝叶斯框架:我们对他们的技能有一些先验信念,我们对其进行更新以反映新信息。
举个具体的例子,我们的新数据包含医生 A、B 和 C 的手术。A 医生是一位已经进行了 5000 次手术的老手,我们可以自信地估计他们的技能比一般人高得多,因为他们很少失败。B 医生刚从另一家医院搬来,所以我们假设他们和普通医生一样熟练。C 医生进行了 100 次手术,失败率比平时高,所以我们认为他们的技能较低,但认识到这是一个小样本,所以我们对冲一下赌注。同样,这显然是贝叶斯设置,但我不确定是否可以使用混合效果模型来完成,或者如何实际构建合理的贝叶斯模型来反映这一点。
所以,总的来说,
- 混合效应模型可以在这里工作吗?(也就是说,根据我们对这个特定随机截距看到的过去数据更新其对医生技能的信心)。
- 我应该转向更直接的贝叶斯框架吗?(我确信混合效应模型具有贝叶斯解释,但我再次不确定它是否专门满足我的需要)。
- 你对模型有什么想法可以做我需要的吗?这意味着一个粗略的基准,而不是一个精英预测模型,即使它不完全适合场景(医生和手术只是一个例子),它也很简单和直观。
感谢大家提供的任何建议!