用于评估解释变量贡献的联盟游戏和Shapley值


1

我有一个问题,乍一看似乎不是联盟游戏,而是可以描述为具有所有二分变量的逻辑回归:1响应变量Y(我稍后称之为特征/紫星)和5个解释变量A ,B,C,DE(也是二进制)。

我试图推断出哪些解释变量对Y的贡献最大,并且最好以某种方式定量评估它们的严重程度(比如排序预测变量,变量选择等),并且我发现与Shapley值有很大的相似性。

它与联盟游戏非常相似,因为它具有强大的合作性,但我不确定我是否可以在这种特殊情况下使用它。这种方法的主要问题在最底部用粗体表示。

您能否看看下面的情况,并推荐一些方法,如何使用Shapley值来推断哪种解释以及在多大程度上对响应Y(特征/紫星)的贡献最大。

比方说,我们有五个不同的对象表示为标记的球:A,B,C,D,E创建一些子集和感兴趣的单个特殊特征标记为紫色星。如果星形被填充,则该特征存在于特定集合中,而空心星形表示其不存在。

在此输入图像描述

25123

我们可以假设(如果需要的话)总是存在至少一个具有该特征的全集实例(例如,标有较厚红包的实例)。

251

  • FACE
  • NACE
  • TACE=FACE+NACE

TXXXYTXTY(A,C,E)(A,B,C,D,E)TACETABCDE。这是因为子集(A,B,C,D,E)的任何实例同时是(A,C,E)的实例,但对于较窄的(A,C,E),我们可以有更多实例。

在本说明书中,我为每个子集类型使用六个实例,因为图片的空间有限,而这六个实例旨在反映具有和缺少该特征的实例之间的总体比例。

251

在此输入图像描述 在此输入图像描述

FACETACE=56,  FBDTBD=16,  FABCDETABCDE=46 (the situation of the very first picture)
FT

FATA=26  (2nd & 4th),  FCTC=26  (2nd & 3rd),  FETE=16  (2nd only)
在此输入图像描述 在此输入图像描述 在此输入图像描述

此外,将A与E或C与E合并不会产生额外的联合效应,因此E本身对整体效果的贡献很小。

在此输入图像描述 在此输入图像描述

{2nd,3rd,4th,6th}{2nd,3rd,4th}

在此输入图像描述

尽管如此,如第二个图所示,E必须触发全部潜力并在第五个实例中显示该特征。

综上所述,我想从数据中推断出哪一个对象有利于特征外观。在我们的例子中,我们可以清楚地看到A和C非常有利(与其他人合作),E不是那么有用,但需要达到最大潜力,而B和D似乎对该特征没有合作效应。

FXTXv(X)Xv:25R(A,B,C,D,E)(A,C,E)

你知道我怎么能推断出这样的贡献?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.