套索逻辑回归的交叉验证

机器算法验证 回归 物流 交叉验证 套索
2022-04-07 02:24:16

我正在用 lasso in 编写逻辑回归例程matlab所以问题是用惩罚项最小化负对数似然函数

(log(1+eXiβ)yiXiβ)+λ|βi|

其中是模型参数,是观察值βXiiXyii

我的第一个问题是 5 折交叉验证,我应该使用哪个标准来选择的最佳值?我应该在验证数据集上使用 logit 函数的值还是在验证数据上使用错误分类率?λ

1个回答

简短的回答是,这取决于您的兴趣。过去我使用 AIC 进行套索。

但是,听起来您正在使用此模型进行预测,因此使用错误分类率是一个好主意。然而,错误分类可以通过多种方式进行分类。您对正确分类的绝对百分比感兴趣吗?或者,也许您只关心那些归类为 1(或者是,等等)的那些,其中有多少被正确分类?我会阅读正面预测值、负面预测值等。

https://en.wikipedia.org/wiki/Positive_and_negative_predictive_values

此外,在进行交叉验证时,您可以使用大量标准来验证您的模型。其他常见标准的简短列表是:

  • R2
  • MSE
  • Mallows Cp
  • AIC

查找它们,看看哪个与您最相关!