假设我有一个有 2 个头的神经网络。第一个由 X 个神经元组成。第二个由 Y 神经元组成。我有这两个头是因为我想预测 2 个不同的变量。我可以看到训练期间每个头部的损失。现在,假设我只有一个由 X+Y 神经元组成的头部。我可以解释输出,因为我知道第一个 X 神经元描述了一些变量,而后一个 Y 神经元描述了第二个变量。我想知道这两种方法之间是否有任何区别(可能在性能或其他方面)。优缺点都有什么?对于某些特定任务,一种方法比另一种方法有什么优势吗?
多头输出和普通输出有什么区别?
人工智能
神经网络
深度学习
深度神经网络
2021-11-14 09:44:52
1个回答
这取决于你的输出是什么。例如,如果两个输出相似,那么您可以使用一个输出分支。但是,如果两个输出不同怎么办?通过两个输出分支,您可以使用两种不同的损失函数。现在您的模型将分别优化这两个分支。
想象一下,如果您有一个模型,它必须为输入输出一个类标签和一个描述输入中某些内容的真实值。一个是分类任务,另一个是回归任务。并且两者需要不同的损失函数,因此您将使用两个分支。
其它你可能感兴趣的问题