机器算法验证 - 套索逻辑回归的交叉验证 - 吾爱随笔录

机器算法验证回归物流交叉验证套索

2022-04-07 02:24:16

我正在用 lasso in 编写逻辑回归例程matlab。所以问题是用惩罚项最小化负对数似然函数

\sum (\log (1 + e^{X_{i}^{'} β}) - y_{i} X_{i}^{'} β) + λ \sum | β_{i} |

$\sum \left(\log(1 + e^{X_i' \beta}) - y_i X_i' \beta\right) + \lambda \sum |\beta_i|$

其中是模型参数，是行，是观察值。 $\beta$ $X_i$ $i$ $X$ $y_i$ $i$

我的第一个问题是 5 折交叉验证，我应该使用哪个标准来选择的最佳值？我应该在验证数据集上使用 logit 函数的值还是在验证数据上使用错误分类率？ $\lambda$

1个回答

简短的回答是，这取决于您的兴趣。过去我使用 AIC 进行套索。

但是，听起来您正在使用此模型进行预测，因此使用错误分类率是一个好主意。然而，错误分类可以通过多种方式进行分类。您对正确分类的绝对百分比感兴趣吗？或者，也许您只关心那些归类为 1（或者是，等等）的那些，其中有多少被正确分类？我会阅读正面预测值、负面预测值等。

此外，在进行交叉验证时，您可以使用大量标准来验证您的模型。其他常见标准的简短列表是：

查找它们，看看哪个与您最相关！

其它你可能感兴趣的问题