可以进行一组较大的设计和设置来学习给定一组标记示例的评分函数。如果目标是简单性和有效性(准确性、可靠性和速度),则应考虑第三种选择。
问题中的要求包括“输出整数等级 0 [到] 4 [包括]。” 对于这样的离散结果,所需的输出位数b(在哪里s是可能的状态数,并且I是整数的集合)如下所示。
minb(b∈I∧b≥log2s)
在这种情况下,我们需要三位输出。
s=5⟹b=3
请注意,对于 0 到 7 的类似配置等级,也只需要三位输出。无论哪种方式,如果输出层的激活函数是二元阶跃函数,它可能是最简单和最有效的。这消除了应用后舍入的需要。然后,输出层将提供一个表示评级的二进制值。学习的目标是减少前馈输出与每个示例的相关标签二进制值之间的误差。
先前的层可以是 sigmoid 或更现代且问题更少的连续激活函数,如 ISRLU。
由于工程师可以选择学习框架使用的误差函数来接受任何输入范围和分布,因此标准化监督学习的标签主要用于消除计算误差所需的时间和资源消耗操作中的冗余。以评级作为标签,除非评级分布是倾斜的并且数据集使得学习时间过长,否则可能不需要归一化。如果是这样,可能是因为提前改进标签分布(需要将浮点输入到误差函数并消除偏斜)会减少学习时间。
其他两种方法引入了上述上下文中提到的不必要的复杂性。在不增加收敛障碍的情况下消除复杂性的结果是在学习期间和学习后的执行期间效率更高。