关于信用评分的好书/论文


11

我正在寻找有关信用评分的书籍的推荐。我对该问题的各个方面都感兴趣,但主要涉及:1)良好的功能。如何建立它们?哪些被证明是好的?2)神经网络。它们在信用评分问题中的应用。3)我选择了神经网络,但是我对其他方法也很感兴趣。


Answers:


6

如果您不熟悉评分系统,那么您的第一本书应该是naeem siddiqi撰写的有关使用SAS进行信用评分的方法。如果您还没有上课,那就去吧。该课程的主要重点是对以数百万美元计价和出售SAS企业矿机的总体理解。

如果您需要理论,则需要大学附近的分类数据分析和数据挖掘课程。即使参加了这些课程,您仍然需要帮助。

目前最流行的技术是

  1. 逻辑回归
  2. 神经网络
  3. 支持向量机和
  4. 随机森林

聚类,判别分析,因素分析,主成分也是必须的。

伊丽莎白·梅斯(Elizabeth Mays)的信用评分也会给您一个很好的概览。

我还参加了SAS研究所的信用风险建模课程,这对我有所帮助。这是一个不断学习的过程,从来没有做过。

贝叶斯人也喜欢他们的方法。

编辑

我也忘了提。逻辑回归是目前最流行的技术,并且将永远是银行将继续使用的技术。除非您的银行不太愿意去理解这些方法,并且其他方法的重点仍然是冒险和赚钱,否则其他方法很难卖给高层管理人员。


谢谢!我要澄清一下:我正在参加一个在线竞赛,目的是预测贷款人违约的可能性。所以1)我可以自由选择任何我喜欢的方法。比赛在2周内结束,2)我没有太多时间进行全面学习。3)所提供的数据是信贷局对以前信用的原始回复,因此我真的很想从该数据中提取非显而易见的特征。
Nya 2013年

另外,感谢您的回复,我一定会看看您的参考资料。
Nya 2013年

1
那是什么比赛?我可以知道吗?
xiaodai 2013年

6

我在信用评分领域工作。即使我喜欢探索不同的方法,但我发现逻辑回归即使不是最好的方法也通常足够好。我没有调查过有关该主题的最新论文,但是从大多数论文的记忆中,您会看到诸如神经网络模型之类的其他方法通常在预测能力(由GINI和AR衡量)方面没有显着提升。同样,对于外行人来说,这些模型往往更难理解(通常大多数高级管理人员没有统计学背景),而使用逻辑回归的记分卡方法似乎提供了最容易解释的模型。没错,大多数记分卡都没有考虑互动,

话虽这么说,最近有人对使用生存分析技术构建计分卡感兴趣,因为它比逻辑回归具有一些优势。也就是说,我们可以更轻松地将宏观经济因素纳入模型,我们可以在模型构建中使用更多最新数据,而不必至少依赖12个月前的数据(因为物流中的二元指标通常被定义为默认值)接下来的12个月)。在这方面,我的论文可以提供另一种观点,即它使用生存分析来探索建立信用记分卡。我展示了生存分析记分卡在外观和感觉上与逻辑回归记分卡相同,因此可以引入它们而不会造成太多麻烦。

在我的论文中,我还描述了ABBA算法,这是一种对变量进行分箱的新颖方法。

https://www.google.com.sg/zh-CN/sa?t=rc&r=c 2Fwikipedia%2Fcommons%2F2%2F2f%2FAbout_Time _-_ Building_Credit_Scorecards_with_Survival_Analysis.pdf&ei = 8D8MUorrJs2Trgf56YCwCQ&usg = AFQjCNGxWRH1naJS4UqH_ckwzTxC = CkbPcTcTc3Axk = PwB1Ctc&Ckb2TxCk = PxCkTk3Ck = P2B1B1E1B1E1B1B1E1B1E1B1E1B1E1B1E1B1E1B&C =美国官方网站

更新: 我没有声称我的论文是否有什么用。这只是该领域从业人员的另一个观点。


1
这似乎没有集中在这个问题上。您的具体建议是“阅读我的论文”。我还没有阅读过它,也没有资格对其进行评估,但是它不符合书本或已发表论文的资格。
Nick Cox

4
@Nick这个问题确实要求“其他方法”,这个答案可以解决。许多人发现指向可下载文本的链接很有用,甚至可能不仅仅是参考。对于匿名举报者:提供指向自己工作的链接不是垃圾邮件。我们在这里欢迎研究人员和其他创新者,并且不希望通过限制他们永远不要引用自己的贡献来限制他们为我们提供帮助的能力!
Whuber

3
我明白@whuber的观点。我也非常同意引用自己的工作是有条理的。xiaodai:我将删除更新。文章的重点是您的论文可能值得一读。如果您不这样认为,则不会发布。不需要添加差异或谦虚的音符。
Nick Cox 2013年

3
  • 我过去曾参考过D.Sharma的R中信用评分指南,它是包括Logistic回归和基于树的方法在内的各种方法的很好的入门参考。
  • 上面的指南使用了具有丰富功能的德国信用数据。如果您搜索数据集,则会找到其他替代方法,分析和比较,这些方法,分析和比较可能有助于告知您数据集的特征选择和模型选择
  • 对于这种二元分类问题,神经网络是一个不错的选择。在现实世界中,信用评分模型也有望提供为什么贷款申请(例如)被拒绝的原因。因此,有一个模型可以帮助您确定一个人的信用历史记录中的哪些功能导致信用评分较低并导致申请被拒绝。与神经网络相比,回归和基于树的方法中的功能更易于解释。如果您仅在适合度上进行评估,NN值得一试
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.