使用 R 开发“信用风险评分系统”

数据挖掘 数据挖掘 r 预测建模
2022-03-05 21:04:47

我想在实习期间实现一个基于“信用德国数据集”的信用风险评分系统。

我使用逻辑回归用 R 开发了一个模型,并对其进行了验证。现在我必须使用这个模型来计算一个新申请人的分数并推断出好坏。

我不知道如何进行?

1个回答

首先,您需要决定如何评估“好”与“坏”,这意味着选择一个指标。在我的脑海中,您有三个选择:

  • 准确性:最简单,但可能具有误导性(如果您的默认值很少并且预测全 0,您仍然可以获得很高的准确性)
  • logloss:惩罚将高def概率分配给优质信用,反之亦然
  • ROC:按从好到坏排序。

一旦您做出选择,请确保您的模型可以生成正确格式的预测(即输出概率而不仅仅是 0/1),并通过训练/验证/测试范例。这应该让你开始。