我想知道损失与损失的导数之间的相关性与单个标量参数,具有相同的样本。这意味着:考虑带有参数的机器学习模型,我想弄清楚两者之间的关系和, 在哪里
直觉上,我想认为它们是正相关的,对吗?如果它是正确的,我如何用数学方式证明它?
我想知道损失与损失的导数之间的相关性与单个标量参数,具有相同的样本。这意味着:考虑带有参数的机器学习模型,我想弄清楚两者之间的关系和, 在哪里
直觉上,我想认为它们是正相关的,对吗?如果它是正确的,我如何用数学方式证明它?
导数与 在某种意义上。实际上,是一个函数,所以我们甚至可以说存在因果关系。
特定点的导数域的,即, 可以是负数也可以是正数。如果, 然后正在增加(相对于)。如果, 然后减少(相对于增加)。
从一个例子中可以很容易地看出这一点。考虑, 然后. 让, 然后,所以函数是递增的。实际上,. 同样,让, 然后,所以函数是递减的。实际上,(请注意,随着我们的增加,函数正在减少!)。
考虑一个只有一个参数的模型,那么损失函数对该参数的偏导数对应于损失函数的导数。因此,上述推理适用于该模型。具有多个参数的模型呢?同样的事情也会发生。
如果函数减小,它的导数是否也会减小?一般来说,不会,这可以从函数及其导数的图中很容易看出。例如,考虑一个抛物线及其导数(它是一个线性函数)的图。
在 y 轴的左侧,抛物线在减小,但它的导数在增加,而在 y 轴的右侧,抛物线在增加,线性函数仍在增加。
这与 ML 模型的损失函数及其偏导数相同。