为什么在转化生物医学中很少使用机器学习技术?

机器算法验证 机器学习 药物
2022-03-30 15:34:30

这是对上一个问题的跟进。这里 :

预测治疗结果的神经网络模型

并且可能被认为是指这个问题的不同方面:

机器学习技术在小样本临床研究中的应用

感谢 Zach 建议重新发布。

我现在对 CART、randomForest、神经网络和机器学习进行了一些相当认真的阅读,了解了 WEKA 和 R 包,看过并关注了斯坦福工程讲座http://www.ml-class.org/课程/班级/索引,我已经进入 Hastie 的 3 章。鉴于我们在面向临床的研究中经常看到的那种数据——大量临床参数 + 大量生化参数 + 笔和纸测试数据 +/- 少量的神经影像数据,我觉得我错过了一些东西。我不经常阅读研究文献中应用的机器学习技术。我的问题是:我是否刚刚抓住了一些可疑的东西,因此通过研究非常了解它的临床医生和生物统计学家而受到合理怀疑,或者这些技术在“业务分析”之外真的被忽视或害怕吗?是什么让它保持“利基”?

2个回答

机器学习技术通常缺乏可解释性。此外,从统计的角度来看,它们往往相当粗糙——例如,神经网络对输入数据不做任何假设。我有一种感觉,很多人(尤其是如果他们有很强的统计背景的话)看不起他们。

机器学习在生物医学领域的记录一直不是很好。机器学习的早期成功来自于高信噪比模式识别领域,例如视觉模式识别。生物学和社会科学的信噪比要低得多。机器学习有效地适应了预测变量之间的大量交互,要做到这一点,您必须拥有巨大的样本量或非常高的信噪比。请参阅机器学习是否使医学着迷?. 此外,许多机器学习从业者将预测任务误解为分类任务。请参阅此处了解更多信息。