对于像猫对狗这样的图像分类问题,输出层为 2。
像糖尿病视网膜病变这样的图像分类问题似乎更像是一个分级分类器。虽然目标范围从 0 到 4(表示条件的严重性),但对于这类问题,将 1 作为输出层还是 5 更好?
我见过两者都使用的 Kaggle 内核。
对于像猫对狗这样的图像分类问题,输出层为 2。
像糖尿病视网膜病变这样的图像分类问题似乎更像是一个分级分类器。虽然目标范围从 0 到 4(表示条件的严重性),但对于这类问题,将 1 作为输出层还是 5 更好?
我见过两者都使用的 Kaggle 内核。
输出的数量将取决于任务和目标的数量。在医学分级的情况下,您可以将问题解释为:
确保检查每个任务的损失函数。这通常会告诉您代码编写者如何决定解决问题。回到您的示例,第一个任务应该有分类损失(例如交叉熵),第二个任务应该有回归(MSE)。还要检查最后一层的激活函数:通常 softmax/sigmoid 用于分类,None 用于回归。
在没有看到数据的情况下说什么会起作用是很复杂的。最近的一场比赛(Janestreet Market 预测)也看到人们将问题作为分类和回归来处理。迄今为止,私有集上评分最高的公共笔记本是基于回归的方法。我怀疑这是因为分类(股票是否会在未来获得正回报)需要对标签进行二值化,这基本上会导致信息丢失。