假设我有一个神经网络,它接受两组特征作为输入并生成相应的输出,例如,生成平均最终成绩:1. 一个班级 N 个学生的工作时间,2. 一个班级 N 个学生的期中成绩同班。在训练期间,神经网络使用许多不同的类进行训练。我想在推理过程中关闭一组特征(即只提供工作时间作为输入)并使用相同的神经网络预测输出。显然,将期中成绩设置为全 0 并不是一个好的选择。我想知道是否有人知道这样做的好方法是什么?
谢谢!
假设我有一个神经网络,它接受两组特征作为输入并生成相应的输出,例如,生成平均最终成绩:1. 一个班级 N 个学生的工作时间,2. 一个班级 N 个学生的期中成绩同班。在训练期间,神经网络使用许多不同的类进行训练。我想在推理过程中关闭一组特征(即只提供工作时间作为输入)并使用相同的神经网络预测输出。显然,将期中成绩设置为全 0 并不是一个好的选择。我想知道是否有人知道这样做的好方法是什么?
谢谢!
据我所知,你不能这样做。
第一的 :
显然,将期中成绩设置为全 0 将是一个不错的选择
不,实际上这是一个非常糟糕的选择,神经网络不理解神奇的参数,意思是,如果你把一个 0 放在那里,它会认为期中成绩是 0,因此它可能会给你一个非常低的期末成绩预测为你。
我的建议是,如果您对此非常感兴趣,请创建布尔因子,训练输入:
当您有 mid-term_grade 训练数据时,mid-term_grade_present 应该是 1,如果没有,则应该是 0。顺便说一句,是的,生成没有 mid-term_grade 的训练数据。
如果您使用的非线性机器学习算法应该足够了,如果您使用线性算法,您应该对 mid-term_grade_present 进行热编码并将其乘以 mid-term_grade,以如下方式结束: