给定相机图像的体温预测应该建模为分类还是回归?

人工智能 机器学习 深度学习 人工智能设计 分类 回归
2021-10-28 06:08:48

总的来说,我对深度学习还很陌生,我目前正面临一个我想使用神经网络解决的问题,我不确定它是分类还是回归问题。我知道分类问题是关于分类输入是属于 A 类还是 B 类(或 C 类……),而回归问题是关于将输入映射到某种连续输出(就像房价问题一样)。

我基本上想用一个简单的摄像机测量一个人的体温。对我来说,这似乎更像是一个回归类型的问题,而不是分类问题,因为我希望神经网络从输入视频帧中产生实际的连续结果值,例如 39°Celsius。但我想到的一个问题是:如果我使用 35°C 到 42°C 范围内的每个整数值作为可能的输出类别会怎样?这将使它成为一个分类问题,对吗?这里的正确方法是什么,为什么?分类还是回归?

2个回答

我认为这取决于您的应用程序以及您拥有的数据。

如果对体温本身的预测不必准确并且像 COLD、NORMAL 和 HOT 之类的类别就足够了,那么您应该保留一个分类。没有分界线,但是随着您增加表示相同比例数字的类的数量,解释结果可能会变得更加困难,因为这些类之间会有分布。

另一方面,如果您选择回归,您将不再受课程的限制,并且可能能够区分 36.5 和 36C 之间的区别(根据维基百科),这可能是normal 和 cold 之间的区别这是类可能无法捕捉到的东西。

要考虑的另一件事是您的训练数据是什么样的,以及您希望预测温度的准确程度。如果您有人物照片和温度读数,读数是在哪里读取的,读数的准确性如何?如果它不准确(+- 1 度),您可能无法给出您想要的准确预测,并且可能只能像上面那样做 3 个不同的类。

如果您没有数据集,那么这完全是另一个问题,并且可能需要另一个问题,因为它取决于您的应用程序。

我认为您的问题很有趣,我希望这可以帮助您了解如何最好地应用深度学习。

由于您被称为您要解决的问题是“测量一个人的体温”,因此输出应该是一个连续的数值。

如果问题陈述是对一个人的体温进行排名或分类为发烧/健康,那么这可能是一个分类问题。

深度学习根据目标目标在输出层使用神经元单元。

几乎所有机器学习方法都会产生连续的价值预测。输出通常使用截止值在单独的步骤中“分类”为一组离散标签。最好生成概率估计作为结果,因为分类步骤会由于选择截止值而引入额外的错误。

例如,为 ImageNet 计算机视觉数据集部署的用于将对象分类为 1000 个对象之一的深度学习模型没有给出对象的类别。相反,他们给出了一个 1000 值的输出,列出了该图像属于特定类别的概率。雪豹的图像会产生 95% 的雪豹、90% 的豹、75% 的猫等的概率。

因此,总而言之,您的任务的输出应该是温度读数,例如 36°C。