具有独特标签的不同对象的样本

数据挖掘 机器学习 分类 多类分类
2022-02-23 05:48:07

假设我有一个从兽医医院采集的样本,我的特征之一是动物的类型和其他一些特征,如发烧、大小、症状等,我的标签是给该动物的药物。

如果每种药物对于该类型的动物都是唯一的(药物A应该给予动物A,并且没有动物B服用药物A)。为整个数据集构建一个分类器与为每只动物构建一个分类器的优缺点是什么(因为动物之间不会有有效的概括)

1个回答

当我们想使用基于患者的深度学习模型或基于个体观察(同一患者可能来过多次)的深度学习模型时,遇到了这个问题。

在您的情况下,它们可能类似于基于动物的模型与具有所有动物的通用模型。

基于动物的优点:

  • 如果你要建立一个动物级别的分类器,与每个动物的一个模型相比,它肯定会更好地概括。

基于动物的缺点:

  • 如果您没有针对一种特定动物的足够数据,那么对于这种情况,您将无能为力。这也有点优势,我不能说兽医的例子,但如果你要使用一个通用的通用模型,它也可能会错误分类预测(因为该特定示例的数据不足) .

我建议你两个都试试。这个世界上没有什么是确定的。只是从过去的经验中的预感和猜测。

希望这可以帮助。