在传统的计算机视觉和计算机图形学中,位姿矩阵是形式的矩阵
并且是将观点从一个框架更改为另一个框架的转换。
在Matrix Capsules with EM Routing论文中,他们说对象的各种子对象的“姿势”由每个胶囊下层编码。但是从论文中描述的过程中,我了解到他们所说的姿势矩阵不符合姿势矩阵的定义。保持上面显示的姿势矩阵的形式没有任何限制。
那么,用“pose”这个词来形容每个胶囊的矩阵?
此外,既然声称胶囊学习了对象的子对象的姿势矩阵,是否意味着它们学习了子对象的视点变换,因为姿势矩阵实际上是一个变换?