我的同事来自社会科学和流行病学背景,接受过最小二乘回归、逻辑回归和生存分析方面的培训。他们喜欢看到 95% 的置信区间和参数系数的 p 值,并且不信任更当前的预测工具,例如神经网络、CART、bagging & boosting 以及惩罚回归技术。
如何温和地向流行病学家/公共卫生同事介绍高级预测模型?
机器算法验证
预测模型
流行病学
教学
社会科学
2022-03-17 04:55:04
1个回答
我将以流行病学家的身份参与进来。
随着医疗保健领域的研究人员和专业人士进入中层管理及其他领域,并且与统计学的新发展脱节,我可以看到惯性设置。
首先,我强烈建议你不要认为这只是惯性,要么是学科不想采用新技术,要么是你的同事与统计学的新发展脱节。你可以参加流行病学学术会议,那里正在开展新的、方法学上非常复杂的工作,但仍然不一定能找到很多关于预测建模的信息。
提示在名称中。预测建模。
流行病学作为一个领域,对预测本身并不特别感兴趣。相反,它的重点是为观察到的人群中的疾病模式开发病因学解释。这两者是相关的,但又是不同的,这通常会导致对纯粹试图最大化模型的预测影响的更现代的分类和预测技术产生某种哲学上的不信任。在极端情况下,人们认为变量选择应该主要使用有向无环图之类的东西来执行,这可以被认为与预测建模的发展方向相反。
这导致它不是他们背景的一部分,不是他们在文献中经常遇到的东西,而且坦率地说,他们接触它很可能是通过那些实际上并不了解他们正在尝试的问题的人解决。
在评论中,这是一个完美的例子:
这让一些人感到震惊——事实上,我们有意将偏差引入惩罚回归以提高预测准确性
我认识的几乎每一位流行病学家,如果你让他们选择的话,他们会选择减少偏见而不是提高准确性。
这并不是说它永远不会被提起。有时确实会使用预测模型——通常在临床案例中,对特定患者的结果的预测非常感兴趣,或者在爆发检测中,这些技术很有用,因为我们不知道会发生什么,也无法确定病因论据。或者当预测确实是目标时 - 例如,在许多曝光估计模型中。他们只是在该领域有点小众。
其它你可能感兴趣的问题