当我们在输出数据集中使用回归算法时,这是因为我们假设我们的输入数据和一些定量值之间存在关系。这表示为:
,其中 x 是输入向量,是随机误差项。
现在,这个随机误差项可以有任何概率分布?
当我们在输出数据集中使用回归算法时,这是因为我们假设我们的输入数据和一些定量值之间存在关系。这表示为:
,其中 x 是输入向量,是随机误差项。
现在,这个随机误差项可以有任何概率分布?
被称为具有 0 均值的噪声项。分布在现实世界中是随机的,但您可以对其分布做出假设。
例如,高斯过程机器学习表明它遵循高斯分布,即: 。
后一种分布的方差可以看作是我们通过最大化似然函数或通过数据集的先验信息获得的超参数。您可以在 Rasmussen、CE 和 CK Williams 这本书中找到更多信息。“我(2006)机器学习的高斯过程。” (2006)
在某些情况下,通过查看您的先验数据并估计可能的误差源,您可以先验地预期误差分布的类型并尝试后验地评估此假设(主要使用数据驱动的方法)。