抛硬币产生的正面或反面之类的随机变量是independent因为每次我们抛掷的结果不依赖于之前的抛掷(换句话说,生成随机变量的函数没有内存)。该示例也是identically distributed因为每个折腾结果都遵循相同的分布(二项分布)。
但是在图像分类(如手写数字数据集)的情况下,IID 的含义是什么。每个样本都独立于之前的样本,但是我们如何确保它们以相同的概率分布生成(或者在这种特定情况下这是什么意思)?
或者在循环神经网络的情况下,我们从系列中创建过样本(根据问题的约束)。我们可以进行洗牌以确保数据集中的样本是独立的,但是样本的相同分布呢?