PSPNet(金字塔场景解析网络)论文链接中提到的辅助损失是什么?
我在下面引用论文的一部分
我们的深度监督 ResNet101 [13] 模型的示例如图 4 所示。除了使用 softmax 损失来训练最终分类器的主分支外,在第四阶段之后应用了另一个分类器,即 res4b22 残差块。与将反向辅助损失阻止到几个浅层的中继反向传播 [32] 不同,我们让两个损失函数通过所有先前的层。辅助损失有助于优化学习过程,而主分支损失承担大部分责任。我们增加权重来平衡辅助损失。
我的问题是这种辅助损失是如何工作的,以及它对训练过程有何帮助。它在网络中的工作是什么?