我正在阅读深度学习这本书,遇到了以下段落(第 109 页,第二段):
训练和测试数据是由称为数据生成过程的数据集上的概率分布生成的。我们通常会做出一组统称为独立同分布假设的假设。这些假设是每个数据集中的示例彼此独立,并且训练集和测试集是相同分布的,它们来自彼此相同的概率分布。这个假设使我们能够用单个示例上的概率分布来描述数据生成过程。然后使用相同的分布来生成每个训练示例和每个测试示例。我们将共享的底层分布称为数据生成分布,表示为. 这种概率框架和独立同分布假设使我们能够在数学上研究训练误差和测试误差之间的关系。
有人可以向我解释这一段的意思吗?
在第122页的最后一段,它还给出了一个例子
一组样本 根据均值的伯努利分布独立同分布 .
这是什么意思?