0
用于评估解释变量贡献的联盟游戏和Shapley值
我有一个问题,乍一看似乎不是联盟游戏,而是可以描述为具有所有二分变量的逻辑回归:1响应变量Y(我稍后称之为特征/紫星)和5个解释变量A ,B,C,D和E(也是二进制)。 我试图推断出哪些解释变量对Y的贡献最大,并且最好以某种方式定量评估它们的严重程度(比如排序预测变量,变量选择等),并且我发现与Shapley值有很大的相似性。 它与联盟游戏非常相似,因为它具有强大的合作性,但我不确定我是否可以在这种特殊情况下使用它。这种方法的主要问题在最底部用粗体表示。 您能否看看下面的情况,并推荐一些方法,如何使用Shapley值来推断哪种解释以及在多大程度上对响应Y(特征/紫星)的贡献最大。 比方说,我们有五个不同的对象表示为标记的球:A,B,C,D,E创建一些子集和感兴趣的单个特殊特征标记为紫色星。如果星形被填充,则该特征存在于特定集合中,而空心星形表示其不存在。 25−125−12^5 - 12323\frac{2}{3} 我们可以假设(如果需要的话)总是存在至少一个具有该特征的全集实例(例如,标有较厚红包的实例)。 25−125−12^5 - 1 FACEFACEF_{ACE} NACENACEN_{ACE} TACE=FACE+NACETACE=FACE+NACET_{ACE} = F_{ACE} + N_{ACE} TXTXT_XXXXX⊂YX⊂YX \subset YTX≥TYTX≥TYT_X \geq T_Y(A,C,E)⊂(A,B,C,D,E)(A,C,E)⊂(A,B,C,D,E)(A, C, E) \subset (A, B, C, D, E)TACE≥TABCDETACE≥TABCDET_{ACE} \geq T_{ABCDE}。这是因为子集(A,B,C,D,E)的任何实例同时是(A,C,E)的实例,但对于较窄的(A,C,E),我们可以有更多实例。 在本说明书中,我为每个子集类型使用六个实例,因为图片的空间有限,而这六个实例旨在反映具有和缺少该特征的实例之间的总体比例。 25−125−12^5 - 1 FACETACE=56, FBDTBD=16, FABCDETABCDE=46 (the situation of the very first picture)FACETACE=56, FBDTBD=16, …