我正在阅读 Krizhevsky 等人的ImageNet Classification with Deep Convolutional Neural Networks论文,并在 Intro 段落中遇到了这些行:
它们的(卷积神经网络)能力可以通过改变它们的深度和广度来控制,它们还对图像的性质(即统计数据的平稳性和像素依赖性的局部性)做出了强有力的且大部分正确的假设。因此,与具有相似大小层的标准前馈神经网络相比,CNN 的连接和参数要少得多,因此它们更容易训练,而它们理论上的最佳性能可能只是稍差一些。
“统计的平稳性”和“像素依赖的局部性”是什么意思?还有,说CNN理论上最好的性能只比前馈NN差一点的依据是什么?