如果我只想预测连续值的范围,是否有任何理由使用回归而不是分类?它是否取决于我使用的模型类型(神经网络、决策树、贝叶斯......)?
例子
假设我有一个带有图像的数据集。每个图像上都有一个人,并标有他/她的身高。现在我只对预测身高范围感兴趣,例如这四个类别[ A, B, C, D ] = [ <150, 150-170, 170-190, >190 ] (in cm)。有什么理由为什么以下两种方法之一会带来更好的性能?
- 案例 1:使用回归- 首先创建并拟合一个模型,该模型可以预测图像的确切高度,然后简单地给出其相关的高度范围。
- 案例 2:使用分类- 首先用想要的范围(=类)标记所有图像,然后创建并拟合分类器来预测这个高度范围。
注意:我想知道这个问题是否有一个普遍的答案,而不仅仅是这个例子
编辑
正如@n1tk 所指出的,在基于 CNN 的具有类数的深度模型的性能一文中,如果我们考虑增加类的数量,这个问题就得到了回答。在我的问题中,我想知道回归与分类。因此,尝试从该值拟合一个连续值与范围。