我正在阅读深度学习这本书,遇到了以下段落(第 109 页,第二段):
训练和测试数据是由称为数据生成过程的数据集上的概率分布生成的。我们通常会做出一组统称为独立同分布假设的假设。这些假设是每个数据集中的示例彼此独立,并且训练集和测试集是相同分布的,它们来自彼此相同的概率分布。这个假设使我们能够用单个示例上的概率分布来描述数据生成过程。然后使用相同的分布来生成每个训练示例和每个测试示例。我们将共享的底层分布称为数据生成分布,表示为. 这种概率框架和独立同分布假设使我们能够在数学上研究训练误差和测试误差之间的关系。
有人可以向我解释这一段的意思吗?
在第122页的最后一段,它还给出了一个例子
一组样本根据均值的伯努利分布独立同分布.
这是什么意思?
这里有几个更具体的问题。
数据集的概率分布:数据集是什么?概率分布是如何产生的?
这些示例彼此独立。你能给我一个例子说明这些例子是依赖的吗?
从彼此相同的概率分布中得出。假设概率分布是高斯分布。术语“相同概率分布”是否意味着所有示例都来自具有相同均值和方差的高斯分布?
“这个假设使我们能够”。这是什么意思?
最后,对于第 122 页的最后一段,给出了样本遵循伯努利分布。这在直觉上意味着什么?