通过在 MNIST 中旋转图像来人为地扩展数据集
数据挖掘
神经网络
深度学习
极简主义
2021-09-23 22:32:26
3个回答
在对您对 Sammy 帖子的评论的某种回应中,问题不限于五度旋转。该问题允许所有旋转。
一个旋转 90 度是不再是. 不要训练你的神经网络来查看并称之为.
一个旋转 180 度是; 一个旋转 180 度是. 不要训练你的神经网络来混淆这些。与, 有沙s 在您的测试数据中。如果你允许旋转到沙到s,您在识别其他数字方面看到的任何改进都可能被混淆所抵消沙s。
类似地,考虑一个混淆 M 和 W 的手写识别器。
“亲爱的妈妈,母亲节快乐!”
或者回到 WNIST,“亲爱的奶奶,69岁生日快乐!明年,我们将从哈利法塔出发进行 BASE 跳伞,为您的第 100 次跳伞!”
不是错字。
Sammy 和 Dave 已经准确地回答了 Nielsen 打算提出的问题,但根据您对 Sammy 回答的评论,我想您想知道任意多个轻微旋转的训练图像是否会导致问题。
任意多个轻微旋转不会有问题;实际上,您可以通过在每个训练步骤生成一批具有小的随机线性变换(旋转是一种线性变换)的图像来模拟这一点,这种方法很常见。例如看这篇文章
为了在这里添加其他答案,将任意旋转的图像放入神经网络并没有本质上的错误。尼尔森希望你能意识到这会在他所谈论的特定领域(数字识别)内引起问题:问题不在于旋转,问题在于告诉网络 180 度旋转的 9仍然是9(实际上是 6)。如果您正在训练一个网络来对血细胞类型进行分类,那么任意旋转训练图像将是一个很好的策略,因为每个细胞的方向不会携带任何特殊信息。
其它你可能感兴趣的问题