如何学习医学研究的统计学?

机器算法验证 教学 药物
2022-03-23 19:47:13

我是去年的医学生,正如我们所说的“实习医生”。将来我想对我想进入的问题进行研究。

因此我想学习数学、统计学、R编程等等,因为我想为我的研究做最好的统计分析。就我而言,正确的统计分析是研究问题之后最重要的部分。

因此,对于我在 Youtube 上观看的 Richard McElreath 统计重新思考视频以及在 DataCamp 课程中学习 R 编程的这些内容,我购买了年度保费计划。据我看,我观看的 Youtube 视频对我来说有点难以理解。如果没有统计子结构,我认为在 DataCamp 上学习 R 编程将处于不稳定的状态。

你会怎么想?我想从比我更有经验的人那里学习想法和建议。你对我有什么建议可以很好地学习这些技能?

4个回答

你会怎么想?

这是一个很好的问题。在攻读生物统计学博士学位期间,我花了很多时间为学术医师及其研究提供咨询服务。如果您(和版主)允许基于意见的答案,那么我很乐意提供。

出于某种原因,医学创造了一种文化,在这种文化中,医生打算自己做所有事情研究设计、数据收集、分析、写作,哦,是的,最重要的是他们的临床职责和更多地了解他们的专业。其中包括流行病学家、数据架构师、统计学家的职责,仅举几例。就个人而言,我认为让研究人员承担如此荒谬的责任。这也可以解释为什么医学研究似乎是复制粘贴,统计数据不佳。统计学难学,医学难学,所以学习两者往往意味着在一个或另一个或两者上走捷径(可以理解的是,牺牲了统计的严谨性)。

正如 whuber 所说,与其屈服于这些期望,不如与生物统计学家交朋友可能更明智。协作是一种很好的学习方式,因为您可以获得针对您的具体情况量身定制的一致建议,而不是来自具有不同学习目标的不同课程的混合方法。我不是说把所有的统计工作都交给统计学家,我也不是说你不应该独立学习统计学,但我认为在当医生的同时急于学习所有这些东西会导致比你有耐心的工作更糟糕和协作。

那么问题是“我如何会见/与生物统计学家交朋友”。您的医学院可能附属于一所大学,其中可能有也可能没有流行病学系。流行病学家非常关注如何在医疗环境中进行质量研究。他们应该精通统计学,以帮助您进行设计、数据收集和分析。如果您没有流行病学系,则可能会有统计/数学系或社会学系的人(社会学与生物统计学不完全一样,但是流行病学家和社会学家之间的差异越来越小)。

编辑:

EdM 很好地说明了基本概率和统计的基础。我不准备列出要学习的主题和学习地点。我认为任何科学本科课程都可以为您提供足够的入门知识。

话虽如此,如果被迫根据概率和统计数据提供一种资源,我会推荐Martin Bland的《医学统计概论》 。这本书面向医学生和介绍状态

本书旨在介绍一些对医学很重要的统计思想。它并没有告诉您进行医学研究所需的所有知识。一旦您理解了这里讨论的概念,就更容易了解回答任何特定问题所需的研究设计和统计分析技术。

然而,这本书不涉及概率,因此您可以自由选择有关该问题的大多数介绍性文本以涵盖该基础。我同意 Bland 的观点,即本书应作为批判性阅读学术医学文献的良好基础,并应作为了解更多医学统计学知识的绝佳起点。

在过去的 14 年里,我一直在努力提高统计水平,包括获得应用硕士学位(老实说,这令人失望)。我认为答案是没有简单的方法可以做到这一点。由于许多使用统计学的学术文献不是由真正的统计学家恕我直言(我当然是这样)完成的,而且他们做的事情(很多事情)违反了各种规则,因为它们不是真的,这使得情况变得更糟专家。简单的例子包括错误地应用方法,忽略对外部有效性的威胁,使用逐步回归,未能解决遗漏变量偏差,从模型中删除变量,因为它们在统计上不显着,以及使用相同的数据重新运行模型等等。多年前一篇可怕的文章查看了《新英格兰医学杂志》和《柳叶刀》上的文章,发现在应用逻辑回归的文章中存在广泛的统计错误,它们当然是精英期刊。这忽略了统计学家经常不同意自己的事实。

因此,如果您要学习统计数据,则需要做很多工作。您可以查看 UCLA (Idre) 站点或杜克大学站点作为时间序列。

上面的讨论提出了很好的观点。我推荐一种寻找生物统计学家合作者和学习生物统计学的平行方法。对于后者,专注于学习生物统计学家不太可能已经知道的东西,以促使他们更好地理解。我试图涵盖BBR中属于这一类的很多东西——生物统计学家和临床研究人员为了取得进展而必须忘掉的东西。仅举一个例子,人们普遍认为,计算基线的变化在分析患者结果时是可以的。BBR 竭尽全力说明为什么不应该从基线计算变化。您会在 datamethods.org 上看到很多关于学习医学统计和合作的讨论。

你弄错了顺序。

就像你说“我想学医,所以我买了一把手术刀”。R 是一个非常有用的工具。但是从使用 R 中学习统计信息要比在已经了解统计信息后学习使用 R 要困难得多。

如果我从零开始学习统计学,我不会从 Baysian 开始。我会开始很简单。首先使用物理对象来了解可能的结果如何起作用(如骰子和硬币)。如果你掷硬币,有多少结果?你能把它们列出来吗?两个硬币怎么样,等等。对一组可能的结果有充分的了解是思考某事物“有可能”落入这些结果的给定子集的最佳基础。

方便的是,这是大多数介绍性统计课程的教学方式。因此,我真的建议您从入门课程开始学习统计数据。

紧随其后,可能下一个最重要的技能是形式逻辑。这很可能是在你的学校或网上根据哲学提出的。你将永远无法通过严格、正式的研究来真正“证明”任何事情。示例:使用逻辑链 A -> B -> C,也许你测试 B->C 一百万次,每次都得到想要的结果。该演示并没有“证明” B-> C。但实际上,我们可能会接受断言 B->C 的研究。你需要的是理解和清楚地陈述你的完整逻辑链和所有假设的基础和纪律。这样做将使分析更容易,并使您的结果更可靠。

一旦你有了它,你就可以更有用地查看贝叶斯方法。我发现最容易将贝叶斯视为处理频率统计的一些认识论问题,这意味着除非您已经了解统计和逻辑链的基础知识,否则它不会有多大意义。(有些人声称从一开始就学习 Baysian 是成功的。我什至无法想象如何有效地做到这一点。YMMV。)

不幸的是,虽然你可以通过这种方式获得应用统计学的扎实工作知识,但如果没有微积分,很难真正理解,而且微积分也相当困难。因此,如果您真的想深入研究,那么这就是您想要复习的地方。然后寻找基于微积分的统计数据。它可能被称为“科学家和工程师的统计数据”或类似名称。