我有一个类似于标题的问题,但不一样。标题上的问题让我可以解释我的需求动态。
我必须确定信用卡的 QUOTA 或 LIMIT 变量的最佳值是多少。
考虑到这个变量和其他表征我的客户的变量,该模型的目标是允许我最小化违约概率。确定这一点的最佳方法是什么?
我想到了两种可能:
- 训练一个模型,将所有外生变量和 LIMIT 作为任何分类模型的变量(Y=Default/No Default)
- 训练一个包含所有外生变量但没有 LIMIT 的模型(Y=Default/No Default),然后用结果概率和 LIMIT 作为仅有的两个变量(Y=Default/No Default)训练另一个模型。
这些可能性听起来对吗?
对于这两种模型,应用程序数据集都应该使用 LIMIT 变量的两个或多个可能值重复客户,并获得每个客户重复的默认概率。这听起来正确吗?