我正在阅读Capsules 之间的动态路由论文,并没有理解摘要中的“活动向量”一词。
胶囊是一组神经元,其活动向量表示特定类型实体(例如对象或对象部分)的实例化参数。我们用活动向量的长度来表示实体存在的概率,用它的方向来表示实例化参数。一层的活动胶囊通过变换矩阵对更高级别胶囊的实例化参数进行预测。当多个预测一致时,更高级别的胶囊变得活跃。我们表明,经过判别训练的多层胶囊系统在 MNIST 上实现了最先进的性能,并且在识别高度重叠的数字方面明显优于卷积网络。为了实现这些结果,我们使用了一个迭代的协议路由机制:
我认为向量就像您通过网络运行的一组数据。
我开始学习 Andrew Ng 的深度学习课程,但一切都是新的,术语也让我头疼。