考虑一个图像标记问题,我需要为图像分配一个或多个标签。可能的标签是human
, moving
, indoor
。人表示图片中有人,移动表示人是否在奔跑/行走等,而室内则区分图像是室内还是室外。
现在我可以使用标记的训练数据在输出层训练一个具有 3 个节点的 DNN。(比如节点 1,用于 +/- 人类,节点 2 +/- 移动等等)
我一直认为这只是使用 DNN 进行多类分类的另一种方式。(多类训练的另一种选择是用一个输出节点以成对或一对多的方式训练许多 DNN。)
但似乎我所描述的(训练具有 3 个输出节点的 DNN)是多任务学习。(我阅读了 MTL 上的 wiki 并查看了这些论文)
我的问题是:我描述的场景是 MTL 吗?如果不是,我错过了什么?如果是,MTL 还有什么其他的吗?(显然有)
我还注意到在 MTL 中一个图像可以有多个标签,但通常在多类中,一个图像只分配一个 - 这是区别吗?