使用神经网络进行序数回归的成本函数

数据挖掘 神经网络 成本函数
2021-09-18 07:15:50

什么是训练神经网络执行序数回归的最佳成本函数,即预测其值存在于任意尺度上的结果,其中只有不同值之间的相对排序是显着的(例如:预测客户将订购哪种产品尺寸: 'small'(编码为 0)、'medium'(编码为 1)、'large'(编码为 2)还是 'extra-large'(编码为 3))?我试图弄清楚是否有比二次损失(将问题建模为“香草”回归)或交叉熵损失(将问题建模为分类)更好的选择。

1个回答

本文提出了另一种人脸年龄估计方法:

https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Niu_Ordinal_Regression_With_CVPR_2016_paper.pdf

作者使用许多二元分类器来预测数据点是否大于阈值,并对多个阈值执行此操作。即在您的情况下,网络将具有三个二进制输出,对应于

  • 大于 0
  • 大于 1
  • 大于 2。

例如,对于“大 (2)”,基本事实将是[1 1 0]. 最终成本函数是每个二元分类器的各个交叉熵成本函数的加权和。

这具有固有地对更大的误差进行更多加权的优点,因为将违反更多的单个成本熵项。简单地对有序结果进行分类分类本身并不具有此功能。