我正在对神经网络进行一些实验,为此我正在尝试编写一个简单的OCR任务。我知道 CNN 是最好的选择,但是由于我的经验不足,我想一步一步地从前馈网络开始。
所以我的训练数据是一组大约 400 个 16*16 的图像,这些图像是从一个脚本中提取的,该脚本将每个字母字符绘制在一个小图像中,用于在我的计算机中注册的一小组字体。
然后测试数据集是从相同的过程中提取的,但针对的是我电脑中的所有字体。
嗯,结果很糟糕。获得大约的准确性。45-50%,非常差……但这不是我的问题。
关键是,无论我对网络应用什么隐藏层分布,我都无法获得低于 0.0049 的 MSE。我尝试了几种架构,都归结为这个数字。这是否意味着网络无法根据数据进一步学习?
然而,这个 MSE 值也会产生这种糟糕的结果。
我直接使用 Tensorflow API,没有 keras 或估计器,对于 62 个可识别字符的列表,这些是我使用过的架构示例:[256,1860,62] [256,130,62] [256,256, 128,62] [256 ,3600,62] ....
但是永远不要让 MSE 低于 0.0049,结果仍然没有超过 50%。
非常感谢任何提示。