我正在用 lasso in 编写逻辑回归例程matlab。所以问题是用惩罚项最小化负对数似然函数
其中是模型参数,是行,是观察值。
我的第一个问题是 5 折交叉验证,我应该使用哪个标准来选择的最佳值?我应该在验证数据集上使用 logit 函数的值还是在验证数据上使用错误分类率?
我正在用 lasso in 编写逻辑回归例程matlab。所以问题是用惩罚项最小化负对数似然函数
其中是模型参数,是行,是观察值。
我的第一个问题是 5 折交叉验证,我应该使用哪个标准来选择的最佳值?我应该在验证数据集上使用 logit 函数的值还是在验证数据上使用错误分类率?
简短的回答是,这取决于您的兴趣。过去我使用 AIC 进行套索。
但是,听起来您正在使用此模型进行预测,因此使用错误分类率是一个好主意。然而,错误分类可以通过多种方式进行分类。您对正确分类的绝对百分比感兴趣吗?或者,也许您只关心那些归类为 1(或者是,等等)的那些,其中有多少被正确分类?我会阅读正面预测值、负面预测值等。
https://en.wikipedia.org/wiki/Positive_and_negative_predictive_values
此外,在进行交叉验证时,您可以使用大量标准来验证您的模型。其他常见标准的简短列表是:
查找它们,看看哪个与您最相关!