神经网络非独立同分布

机器算法验证 神经网络 独立同居
2022-03-29 12:26:12

在神经网络中使用非独立同分布样本是否被认为是不正确的,例如,如果我在图像中有像素作为观察值?

我已经读过这是一个假设,但是如果不是这种情况并且样本不是 iid 并且我想使用多层感知器,我可以这样做吗?

该模型适用于非 iid 样本,所以这不是一个强烈的要求吗?

2个回答

有几种方法可以在神经网络中进行独立假设。一是您的所有样本都是独立的,即如果您有一个包含 10,000 张猫图片的数据库,您假设它们都是彼此独立拍摄的。

另一个是如果你想回归某些值。假设你想从猫的照片中回归它的大小和重量。如果你只是最小化你对两个值的预测的平方和,你就会引入重量和大小是独立的假设——事实并非如此。


第一种情况可以从数学上看出,您的目标函数通常是项的总和,每个样本一个。 之后,总和只不过是对数域中的乘积 这意味着数据样本因式分解——它们是独立的。独立性的定义:

L(θ)=ii
log(ab)=loga+logb
L(θ)=logiexp(i),
p(a)p(b)=p(a,b)a is independend of b

对于第二种情况,请注意平方和是 Normal 的对数密度。如果你有一个很大的总和,这也意味着对许多正态分布的随机变量的乘积,因此意味着一个独立的假设。

不以数学为目标:使用 ANN 可以使用非独立和/或不均匀分布的变量。这样做可能会引发一些副作用,例如分布不均的变量具有过长的训练阶段,陷入(其他)局部最优(尽管这在应用案例中不是问题),或者没有获得最优错误从数学的角度来看,在最小化期间​​。但从技术上讲,对于 ANN 的输入变量来说,满足这些属性绝对不是硬性要求——ANN 也可以很好地处理这些属性。想想所有的深度学习方法,人们倾向于(或多或少地)输入他们掌握的任何信息,大多数情况下没有复杂的预处理。