我想了解如何在xgboost 示例脚本中计算 logloss 函数的梯度和粗麻布。
我已经简化了获取 numpy 数组的函数,并生成了这些数组y_hat
,y_true
它们是脚本中使用的值的示例。
这是简化的示例:
import numpy as np
def loglikelihoodloss(y_hat, y_true):
prob = 1.0 / (1.0 + np.exp(-y_hat))
grad = prob - y_true
hess = prob * (1.0 - prob)
return grad, hess
y_hat = np.array([1.80087972, -1.82414818, -1.82414818, 1.80087972, -2.08465433,
-1.82414818, -1.82414818, 1.80087972, -1.82414818, -1.82414818])
y_true = np.array([1., 0., 0., 1., 0., 0., 0., 1., 0., 0.])
loglikelihoodloss(y_hat, y_true)
对数损失函数是和,其中。
梯度(相对于 p)然后是但是在代码中它的。
同样的二阶导数(关于 p)是 但是在代码中是。
方程如何相等?