我正在尝试使用遗传算法训练前馈神经网络,并且我已经使用均方误差和分类误差函数作为 GA 中的适应度启发式进行了一些测试。
当我使用 MSE 作为误差函数时,我的 GA 趋向于在 MSE 为 0.1 附近收敛(初始条件的 MSE 为 0.9 左右)。使用这个网络测试系统的准确度为我提供了 95% 以上的训练和测试数据。
但是,当我使用分类错误作为我的启发式方法时,我的 GA 往往会在 MSE 约为 0.3 时收敛。系统准确度仍然大致相同,为 95%+。
我的问题是,如果您有两个网络,一个显示 MSE 为 0.1,一个显示 MSE 为 0.3,但两者在准确性方面的表现大致相同,我可以从 MSE 的差异中推断出什么?
换句话说:即使准确度相同,哪个网络“更好”?较低的 MSE 是否意味着低于一定数量?我可以将我的网络训练 100 倍的代数并获得更好的 MSE,但不一定有更好的准确性。为什么?
对于某些情况:
当 MSE 大约为 1.5(epoch 250)时,准确度似乎与 MSE 大约为 2.0(epoch 50)相匹配。为什么尽管 MSE 降低,但准确率却没有提高?