我有两个训练有素的模型。一种是使用 LinearSVC 算法,并使用来自糖尿病视网膜病变患者的医学检查的数值数据进行训练。第二个是对患有相同疾病的患者的视网膜扫描图像进行训练的神经网络。
这些模型预测患者是否患有视网膜病变。两者都是使用 Python 3.6 和 Keras 编写的,准确度约为 0.84。
是否可以以任何方式结合这两个模型来提高预测的准确性?
我不确定以何种方式可以实现,因为他们使用的是不同类型的数据。我尝试过使用集成方法,但没有得到更好的分数。
我有两个训练有素的模型。一种是使用 LinearSVC 算法,并使用来自糖尿病视网膜病变患者的医学检查的数值数据进行训练。第二个是对患有相同疾病的患者的视网膜扫描图像进行训练的神经网络。
这些模型预测患者是否患有视网膜病变。两者都是使用 Python 3.6 和 Keras 编写的,准确度约为 0.84。
是否可以以任何方式结合这两个模型来提高预测的准确性?
我不确定以何种方式可以实现,因为他们使用的是不同类型的数据。我尝试过使用集成方法,但没有得到更好的分数。
您可以尝试使用多输入模型。这是最近发表的一篇类似讨论的帖子,答案中定义了所需的架构。
您可以创建一个并排使用图像和数字数据的模型,而不是组合单独的模型。Keras 允许您通过功能性 API使用多输入结构来使用不同类型的数据。然后您可以将它们组合起来以创建一个单一的机器学习模型。基本思路是这样的:
这张图片是从这里拍摄的,你可以在这里找到更多的细节和代码实现。实际上,该帖子介绍中的讨论与您的问题几乎相同:输入为:
- 数字/连续值,例如年龄、心率、血压
- 分类值,包括性别和种族
- 图像数据,例如任何 MRI、X 射线等。
此外,本博文的第 5.1 节详细介绍了相同的过程。