神经网络如何区分旋转的 6 位和 9 位数字?

人工智能 神经网络 分类 文件 特征 极简主义
2021-11-15 04:42:14

Rotated MNIST是一个流行的数据集,用于对等价于旋转的模型进行基准测试R2,描述为SO(2)组或其离散子组,如Zn

它由从 0 到 9 以任意角度旋转的所有数字组成[0,2π). 然而,让我有点疑惑的是,数字69似乎对任何学习算法都感到困惑,因为从人类感知的角度来看6旋转 180 度相当于9反之亦然。

Rotated MNIST 描述中的原始论文根本没有评论这一点,这很奇怪,因为这是一个很自然的问题。

在此处输入图像描述

在论文Oriented Response Networks - 作者绘制了通过 t-SNE 在 2d 平面上投影的旋转数字的嵌入。6 的所有轮换版本和 ORN 的 9 轮换版本之间有明显的区别。

在此处输入图像描述

我不明白它是如何实现的?可能,网络在写数字时理解得更多,有一些微妙的特征,人类无法访问,但可以被强大的分类器识别?

0个回答
没有发现任何回复~