随机梯度下降是伪随机的吗?

机器算法验证 机器学习 神经网络 梯度下降 随机梯度下降
2022-04-20 09:44:52

我知道随机梯度下降随机选择 1 个样本来更新权重。一个纪元被定义为使用所有N样品。因此,对于 SGD,对于每个 epoch,我们都会更新权重N次。

我的困惑是,这不是成功了吗,所以你必须经历所有N样品之前你可以看到相同的样品两次?这不是有效地使它成为伪随机/随机的吗?如果它完全是随机的,那么在遍历所有样本之前就有可能不止一次看到相同的样本N样品。

1个回答

精疲力尽N能够重复样本之前的样本意味着该过程不是独立的。然而,这个过程仍然是随机的。

考虑一副洗过的牌。你看看最上面的牌,看看A(黑桃 A),并将其放在一边。你永远不会看到另一个A在整个甲板上。但是,您对剩余 51 张牌的顺序一无所知,因为这副牌是洗牌的。从这个意义上说,牌组的其余部分仍然具有随机顺序。下一张卡可能是2或者J. 你不确定;你只知道下一张牌不是黑桃 A,因为你放了唯一的A在其他地方面朝上。

在您概述的场景中,您建议查看最上面的牌,然后再次将其洗入牌库。这意味着看到的概率A独立于先前观察到的卡片事件的独立性是概率论中的一个重要属性,但并不要求定义一个随机过程。

您可能想知道为什么一个人会想要使用非独立策略构建小批量。这个问题在这里得到了回答:为什么神经网络研究人员关心时代?