计算疾病出现的概率

机器算法验证 可能性 发病率比
2022-03-27 06:17:34

我是一名医生,所以请善待我和我对统计的基本理解。

我有一个由患者及其就诊组成的数据集,并且我用 {0,1} 值(0 = 不存在,1 = 存在)标记了他们左手和/或右手中存在的特定种类的痣。数据集如下所示:

**由于提供了答案,我将其删除;我可以根据新要求发送

因此,这意味着患者 A1-001 进行了 6 次就诊,在所有就诊期间右手均没有痣,而在除第一次之外的所有就诊中左手均出现痣。

我有兴趣在一只手患痣的患者中找到一只手患痣的概率,并在另一方面找到患痣的概率(假设患者的另一只手已经有痣) .

此外,我想知道双手在某个时间点出现痣的患者在就诊中出现痣的概率是多少

你能帮我模拟这些简单的问题吗?

3个回答

我个人觉得这很适合生存分析。

在该时期开始时,您的某只手上没有痣的人(您的高危人群);您可以选择这些,并且您有跟进的时间点以及它们是否被审查(开发了痣)。这会给您选择的任何群组带来风险。

然后,您可以计算风险比(例如,在基线时有左手痣的人与没有左手痣的人发展右手痣)。这可以在 Kaplan-Meier 图上表示,并带有置信区间。

这里不需要建模,你所有的问题都是简单的条件概率。

好吧,由于人们不喜欢这个答案,你需要澄清几件事。

我有兴趣在一只手患痣的患者中找到一只手患痣的概率,并在另一方面找到患痣的概率(假设患者的另一只手已经有痣) .

你的意思是每次访问?或者他们从来没有长过痣?从你的例子:

患者 1 和 3 的一侧出现了痣。另一方面,患者 1 从未长过痣,但患者 3 长了痣,因此您可以争辩说您的问题的答案是 50%。现在,您还可以争辩说,患者 1 进行了 4 次检查,有 1 颗痣,而患者 3 有 0 次检查,只有 1 颗痣,而另一个没有,所以概率可能是 1/5 = 20%。这取决于你如何定义你的问题。

就个人而言,我认为您可以从研究多协方差广义线性模型开始:https ://cran.r-project.org/web/packages/mcglm/index.html

https://cran.r-project.org/web/packages/mcglm/vignettes/GLMExamples.html

http://cursos.leg.ufpr.br/mcglm4aed/slides/2-mcglm.html#(1)

当您有多个响应变量并且它们不是高斯时,这些模型适用,这是您的情况,因为您有两个二元变量(每只手都有痣或不是痣)。此外,该方法允许您处理由纵向结构给出的个体内部依赖关系。在这里,纵向意味着对同一个人的重复测量,沿时间。

我认为上面的链接将帮助您对这些技术有一个很好的了解,它们还提供了 R 中的计算实现。