信用卡额度的两步优化

数据挖掘 逻辑回归 数据科学模型 优化
2022-02-26 21:05:36

我有一个类似于标题的问题,但不一样。标题上的问题让我可以解释我的需求动态。

我必须确定信用卡的 QUOTA 或 LIMIT 变量的最佳值是多少。

考虑到这个变量和其他表征我的客户的变量,该模型的目标是允许我最小化违约概率。确定这一点的最佳方法是什么?

我想到了两种可能:

  • 训练一个模型,将所有外生变量和 LIMIT 作为任何分类模型的变量(Y=Default/No Default)
  • 训练一个包含所有外生变量但没有 LIMIT 的模型(Y=Default/No Default),然后用结果概率和 LIMIT 作为仅有的两个变量(Y=Default/No Default)训练另一个模型。

这些可能性听起来对吗?

对于这两种模型,应用程序数据集都应该使用 LIMIT 变量的两个或多个可能值重复客户,并获得每个客户重复的默认概率。这听起来正确吗?

1个回答

您可以将其建模为二元逻辑回归。目标是违约概率。其中一项功能是信用卡限额。

逻辑回归允许计算优势比。奇数比率将给出增加信用卡限额的效果,以预测是否会发生违约。

逻辑回归允许将阈值设置为“最小化违约概率”。