给定一个机器人,例如在图书馆看书。
现在我想创建一个神经网络,在这种情况下建议采取适当的行动。而且,一般来说,忽略诸如“起床跳舞”之类的动作。
由于机器人可以做的动作是无限的,我需要把它缩小到在这种情况下的那些。使用它的视觉系统,“书”这个词和书本神经元应该已经被激活以及“阅读”。
我的一个想法是创建一个对抗网络,它根据“翻页”、“阅读下一行”等情况生成单词(字母序列)。然后有另一个神经网络将这些词转化为行动。(他们会模拟这是否是一个好主意。如果不是,它会以某种方式抑制第一个单词并尝试生成一个新单词。)
另一个例子是机器人在迷宫中并到达十字路口。网络将生成单词“左转”和“右转”。
另一个想法是让动作由身体部位(例如“眼睛”)和动作(例如“向左移动”)组成,并将这些组合起来以建议动作。
不管怎样,我似乎需要一种对动作进行编码的方法,这样机器人就不会考虑宇宙中所有可能的动作。
在这方面是否有任何研究或关于如何实现这一目标的想法?
(我认为这可能与“尽可能多地命名动物”的任务有关。)