Rotated MNIST是一个流行的数据集,用于对等价于旋转的模型进行基准测试,描述为组或其离散子组,如:
它由从 0 到 9 以任意角度旋转的所有数字组成. 然而,让我有点疑惑的是,数字和似乎对任何学习算法都感到困惑,因为从人类感知的角度来看旋转 180 度相当于反之亦然。
Rotated MNIST 描述中的原始论文根本没有评论这一点,这很奇怪,因为这是一个很自然的问题。
在论文Oriented Response Networks - 作者绘制了通过 t-SNE 在 2d 平面上投影的旋转数字的嵌入。6 的所有轮换版本和 ORN 的 9 轮换版本之间有明显的区别。
我不明白它是如何实现的?可能,网络在写数字时理解得更多,有一些微妙的特征,人类无法访问,但可以被强大的分类器识别?