我正在寻找有关信用评分的书籍推荐。我对这个问题的各个方面都感兴趣,但主要是:1)好的特性。如何建造它们?哪些被证明是好的?2)神经网络。他们在信用评分问题上的应用。3)我选择了神经网络,但我也对其他方法感兴趣。
关于信用评分的好书/论文
如果您是评分世界的新手,您的第一本书应该是 naeem siddiqi 关于使用 SAS 进行信用评分的书。如果你还没有上过课,那就去吧。课程主要重点是对价值数百万美元的 SAS 企业矿工的评分和销售的整体理解。
如果您需要理论,则需要附近大学的分类数据分析和数据挖掘课程。即使上完这些课程,您仍然需要帮助。
目前最流行的技术是
- 逻辑回归
- 神经网络
- 支持向量机和
- 随机森林
聚类、判别分析、因子分析、主成分也是必须的。
elizabeth mays 的信用评分也会给你一个很好的概述。
我还参加了SAS Institute的信用风险建模课程,对我有一点帮助。这是一个不断学习的过程,而且从未完成。
贝叶斯人也喜欢他们的方法。
编辑
我也忘了提。逻辑回归是目前最流行的技术,并且将永远是银行将继续使用的技术。其他方法很难卖给高层管理人员,除非您的银行愿意不太关心了解这些方法,并且他们的重点仍然是冒险和赚钱。
我在信用评分领域工作。尽管我喜欢探索不同的方法,但我发现逻辑回归即使不是最好的方法,也通常足够好。我没有调查有关该主题的最新论文,但从大多数论文的记忆中,您会发现其他方法(例如神经网络模型)通常不会在预测能力(通过 GINI 和 AR 测量)方面提供显着提升。此外,这些模型对于外行来说往往更难理解(通常大多数高级管理人员没有统计学背景),而使用逻辑回归的记分卡方法似乎提供了最容易解释的模型。诚然,大多数记分卡都没有考虑到互动,
话虽如此,最近人们对使用生存分析技术构建记分卡产生了一些兴趣,因为它比逻辑回归具有一些优势。也就是说,我们可以更容易地将宏观经济因素纳入模型,我们可以在模型构建中使用更新的数据,而不必依赖至少 12 个月前的数据(因为物流中的二元指标通常在未来 12 个月)。在这方面,我的论文可以提供另一个视角,因为它探索了使用生存分析来构建信用记分卡。我展示了生存分析记分卡的“外观和感觉”与逻辑回归记分卡相同,因此可以引入它们而不会造成太多麻烦。
在我的论文中,我还描述了 ABBA 算法,它是一种对变量进行分箱的新方法。
更新: 我不声称我的论文是否好。这只是该领域从业者的另一个视角。
- 我过去曾参考D. Sharma的 R 中信用评分指南,它是关于逻辑回归和基于树的方法等方法的很好的介绍性参考
- 上述指南使用具有丰富功能的德国信用数据。如果您搜索数据集,您会发现其他替代方法、分析和比较可能有助于为您的数据集提供特征选择和模型选择
- 对于二元分类问题,神经网络是一个公平的选择。在现实世界中,信用评分模型还有望提供贷款申请(例如)被拒绝的原因。因此,有一个模型可以帮助您识别信用记录中的哪些特征导致信用评分低并导致申请被拒绝。与神经网络相比,回归和基于树的方法中的特征更容易解释。如果您纯粹根据合身度进行评估,NN 值得一试