什么是“拒绝推理”，如何将其用于提高模型的准确性？

10

谁能详细解释一下：

拒绝推理是什么意思？
如何使用它来提高模型的准确性？

我确实有在信用卡申请中拒绝推论的想法，但是想办法使用它来提高模型的准确性。

logistic

23

在信用模型构建中，拒绝推论是推论在申请过程中被拒绝的信用帐户的性能的过程。

在构建应用程序信用风险模型时，我们要构建一个具有“ 整个过程 ”适用性的模型，即，我们将所有应用程序数据输入到信用风险模型中，并且该模型输出风险等级或概率默认。使用回归从过去的数据构建模型时的问题是，我们只知道过去接受的应用程序的帐户性能。但是，我们不知道次品的性能，因为在应用次品之后，我们将它们送出了大门。这可能会导致模型中的选择偏见，因为如果我们仅在模型中使用过去的“接受”，则该模型在“通过门”群体上的表现可能不会很好。

处理拒绝推理的方法有很多，所有这些方法都有争议。我会在这里提及两个简单的问题。

“将过去的拒绝定义为不良”
包裹包裹

“将过去的拒绝定义为不良”只是获取所有被拒绝的应用程序数据，而不是在构建模型时将其丢弃，而是将它们全部分配为不良。此方法将模型严重偏向于过去的接受/拒绝策略。

“包裹”要复杂一些。它包括

使用过去的“接受”构建回归模型
将模型应用于过去的拒绝，为他们分配风险等级
使用每个风险等级的预期违约概率，将被拒绝的申请分配为好或坏。例如，如果风险等级的违约概率为10％，并且有100个被拒绝的应用程序属于该风险等级，则将10个拒绝项分配为“不良”，将90个拒绝项分配为“良好”。
使用接受的应用程序以及现在推断的拒绝应用程序的性能重建回归模型

在第3步中，有不同的方法可以分配好或坏，并且此过程也可以迭代地应用。

如前所述，拒绝推理的使用是有争议的，很难就如何使用它来提高模型的准确性给出简单的答案。我将在这件事上简单地引用一些其他内容。

乔纳森·克鲁克（Jonathan Crook）和约翰·班纳西克（John Banasik），拒绝推理是否真的提高了应用评分模型的性能？

首先，即使在很大比例的申请人被拒绝的情况下，仅对被接受者进行参数化的模型的改进范围似乎也很小。如果拒绝率不是很大，那么范围似乎确实很小。

戴维·汉德（David Hand），《信贷业务的直接推论》，发表在《信贷评分手册》（2001年）中

已经提出并使用了几种方法，尽管其中一些方法显然很差并且不应该被推荐，但是除非获得额外的信息，否则没有唯一的普遍适用的最佳方法。也就是说，最好的解决方案是获取有关落入拒绝区域的那些申请人的更多信息（也许通过向某些潜在的拒绝项提供贷款）。

— 德里克·普洛（Derek Ploor）
source

1

+1以获得广泛的概述。现在，我也知道什么是拒绝推理：)

— mpiktas 2011年

1

谢谢。但是如何在步骤3中分配？我读过使用1或0的感觉，您可以为每一行使用概率。因此，您将拥有10％和90％的同一个人。如何与新的物流模型创建一起工作？

— GabyLP

1

@GabyLP在之前的评论中。根据我的经验，您可以将此类客户分为两部分，并根据概率为这两项划分分配权重。例如，如果一个被拒绝的客户有10％的违约概率，则可以从这个客户中选出两个客户。首先具有目标变量1和权重0.1，第二具有目标变量0和权重0.9。

整个接受的客户样本的权重== 1。

虽然这适用于逻辑回归，但不适用于基于树的模型。

— 米克斯
source

您有陈述的来源吗？

— T. Beige，

如果问题是在基于树的模型上不起作用，那么我的答案是-个人经验。我试图实现这种方法，但没有成功。

— MiksL '18 / 12/1