是否存在利用某种自上而下信息传输(不仅在训练期间)的深度学习模型?
例如,如果模型用于语音识别。下层会听样本并说:“‘一’这个词,‘二’这个词,我无法理解这个样本是什么”。然后上层会建议:“会不会是‘三’这个词,在‘一’和‘二’之后并不少见”。然后下层就像:“既然你说了!当然是‘三’”
我很确定这样的架构是可靠语音识别的必要条件,尤其是在嘈杂的环境中。
是否存在利用某种自上而下信息传输(不仅在训练期间)的深度学习模型?
例如,如果模型用于语音识别。下层会听样本并说:“‘一’这个词,‘二’这个词,我无法理解这个样本是什么”。然后上层会建议:“会不会是‘三’这个词,在‘一’和‘二’之后并不少见”。然后下层就像:“既然你说了!当然是‘三’”
我很确定这样的架构是可靠语音识别的必要条件,尤其是在嘈杂的环境中。