谁能详细解释一下:
- 拒绝推理是什么意思?
- 如何使用它来提高模型的准确性?
我确实有在信用卡申请中拒绝推论的想法,但是想办法使用它来提高模型的准确性。
谁能详细解释一下:
我确实有在信用卡申请中拒绝推论的想法,但是想办法使用它来提高模型的准确性。
Answers:
在信用模型构建中,拒绝推论是推论在申请过程中被拒绝的信用帐户的性能的过程。
在构建应用程序信用风险模型时,我们要构建一个具有“ 整个过程 ”适用性的模型,即,我们将所有应用程序数据输入到信用风险模型中,并且该模型输出风险等级或概率默认。使用回归从过去的数据构建模型时的问题是,我们只知道过去接受的应用程序的帐户性能。但是,我们不知道次品的性能,因为在应用次品之后,我们将它们送出了大门。这可能会导致模型中的选择偏见,因为如果我们仅在模型中使用过去的“接受”,则该模型在“通过门”群体上的表现可能不会很好。
处理拒绝推理的方法有很多,所有这些方法都有争议。我会在这里提及两个简单的问题。
“将过去的拒绝定义为不良”只是获取所有被拒绝的应用程序数据,而不是在构建模型时将其丢弃,而是将它们全部分配为不良。此方法将模型严重偏向于过去的接受/拒绝策略。
“包裹”要复杂一些。它包括
在第3步中,有不同的方法可以分配好或坏,并且此过程也可以迭代地应用。
如前所述,拒绝推理的使用是有争议的,很难就如何使用它来提高模型的准确性给出简单的答案。我将在这件事上简单地引用一些其他内容。
乔纳森·克鲁克(Jonathan Crook)和约翰·班纳西克(John Banasik),拒绝推理是否真的提高了应用评分模型的性能?
首先,即使在很大比例的申请人被拒绝的情况下,仅对被接受者进行参数化的模型的改进范围似乎也很小。如果拒绝率不是很大,那么范围似乎确实很小。
戴维·汉德(David Hand),《信贷业务的直接推论》,发表在《信贷评分手册》(2001年)中
已经提出并使用了几种方法,尽管其中一些方法显然很差并且不应该被推荐,但是除非获得额外的信息,否则没有唯一的普遍适用的最佳方法。也就是说,最好的解决方案是获取有关落入拒绝区域的那些申请人的更多信息(也许通过向某些潜在的拒绝项提供贷款)。
@GabyLP在之前的评论中。根据我的经验,您可以将此类客户分为两部分,并根据概率为这两项划分分配权重。例如,如果一个被拒绝的客户有10%的违约概率,则可以从这个客户中选出两个客户。首先具有目标变量1和权重0.1,第二具有目标变量0和权重0.9。
整个接受的客户样本的权重== 1。
虽然这适用于逻辑回归,但不适用于基于树的模型。