在使用神经网络的数字分类中,使用边缘图像进行训练是否优于灰度图像?

人工智能 神经网络 机器学习 图像识别
2021-11-04 13:29:23

我正在尝试识别车牌中的数字和字母。车牌图像在不同的照明条件下拍摄并转换为灰度图像。我对训练数据类型的担忧是:

灰度图像:

  • 由于它们是在不同的光照条件下拍摄的,因此相同数量的灰度图像具有不同的像素强度。这意味着,我必须针对不同的照明条件获取许多训练数据才能进行训练。

边缘图像:

  • 它们缺乏足够的像素信息,因为只有边缘是白色的,而其他(背景)是黑色的。因此,我认为它们对于诸如剪切或移位之类的平移差异将非常弱。

我想获得一些关于在不同光照条件下哪种类型的图像更适合训练数量的信息。如果它们差异不大,我希望使用边缘图像,因为我现在可以准备边缘图像。

1个回答

理论上,如果系统在将图像发送到 NN 之前使用线性高通滤波器对图像进行预处理,则误差率不会增加。

让我们看一个支持此陈述的简单一维案例:

假设输入是“a”、“b”和“c”。第一个隐藏层的节点将接收到激活函数的输入,等于 s=w1*a+w2*b*w3*c+... 是 w1, w2, w3, ... 该节点的权重。

现在,假设一个简单的差分情况,其中输入将是 ... , b'=ba, c'=cb, ... 是隐藏节点 s=w1'a'+w2'b'+w3' 的输入c'+...=...+w2'(ba)+w3'(cb)+...=...+(w2'-w3')b+...

请注意,如果 w1=w1'-w2', w2=w2'-w3', ... ,则隐藏节点的两个输入是相同的。因此,NN 本身可以执行与调整第一个隐藏层权重的线性高通滤波等效的操作。

但是,可以预期学习速度(收敛时间)的变化。

(ps:请在本站激活tex/latex,紧急!)