用于评估解释变量贡献的联盟游戏和Shapley值

我有一个问题，乍一看似乎不是联盟游戏，而是可以描述为具有所有二分变量的逻辑回归：1响应变量Y（我稍后称之为特征/紫星）和5个解释变量A ，B，C，D和E（也是二进制）。

我试图推断出哪些解释变量对Y的贡献最大，并且最好以某种方式定量评估它们的严重程度（比如排序预测变量，变量选择等），并且我发现与Shapley值有很大的相似性。

它与联盟游戏非常相似，因为它具有强大的合作性，但我不确定我是否可以在这种特殊情况下使用它。这种方法的主要问题在最底部用粗体表示。

您能否看看下面的情况，并推荐一些方法，如何使用Shapley值来推断哪种解释以及在多大程度上对响应Y（特征/紫星）的贡献最大。

比方说，我们有五个不同的对象表示为标记的球：A，B，C，D，E创建一些子集和感兴趣的单个特殊特征标记为紫色星。如果星形被填充，则该特征存在于特定集合中，而空心星形表示其不存在。

$2^5 - 1$ $\frac{2}{3}$

我们可以假设（如果需要的话）总是存在至少一个具有该特征的全集实例（例如，标有较厚红包的实例）。

$2^5 - 1$

$F_{ACE}$
$N_{ACE}$
$T_{ACE} = F_{ACE} + N_{ACE}$

$T_X$ $X$ $X \subset Y$ $T_X \geq T_Y$ $(A, C, E) \subset (A, B, C, D, E)$ $T_{ACE} \geq T_{ABCDE}$ 。这是因为子集（A，B，C，D，E）的任何实例同时是（A，C，E）的实例，但对于较窄的（A，C，E），我们可以有更多实例。

在本说明书中，我为每个子集类型使用六个实例，因为图片的空间有限，而这六个实例旨在反映具有和缺少该特征的实例之间的总体比例。

$2^5 - 1$

\frac{F_{A C E}}{T_{A C E}} = \frac{5}{6}, \frac{F_{B D}}{T_{B D}} = \frac{1}{6}, \frac{F_{A B C D E}}{T_{A B C D E}} = \frac{4}{6} (the situation of the very first picture)

$\frac{F_{ACE}}{T_{ACE}} = \frac{5}{6}, ~~ \frac{F_{BD}}{T_{BD}} = \frac{1}{6}, ~~ \frac{F_{ABCDE}}{T_{ABCDE}} = \frac{4}{6} ~\text{(the situation of the very first picture)}$

\frac{F}{T}

$\frac{F}{T}$

\frac{F_{A}}{T_{A}} = \frac{2}{6} (2nd & 4th), \frac{F_{C}}{T_{C}} = \frac{2}{6} (2nd & 3rd), \frac{F_{E}}{T_{E}} = \frac{1}{6} (2nd only)

$\frac{F_A}{T_A} = \frac{2}{6} ~~ \text{(2nd & 4th)}, ~~ \frac{F_C}{T_C} = \frac{2}{6} ~~ \text{(2nd & 3rd)}, ~~ \frac{F_E}{T_E} = \frac{1}{6} ~~ \text{(2nd only)}$