我有一个问题,乍一看似乎不是联盟游戏,而是可以描述为具有所有二分变量的逻辑回归:1响应变量Y(我稍后称之为特征/紫星)和5个解释变量A ,B,C,D和E(也是二进制)。
我试图推断出哪些解释变量对Y的贡献最大,并且最好以某种方式定量评估它们的严重程度(比如排序预测变量,变量选择等),并且我发现与Shapley值有很大的相似性。
它与联盟游戏非常相似,因为它具有强大的合作性,但我不确定我是否可以在这种特殊情况下使用它。这种方法的主要问题在最底部用粗体表示。
您能否看看下面的情况,并推荐一些方法,如何使用Shapley值来推断哪种解释以及在多大程度上对响应Y(特征/紫星)的贡献最大。
比方说,我们有五个不同的对象表示为标记的球:A,B,C,D,E创建一些子集和感兴趣的单个特殊特征标记为紫色星。如果星形被填充,则该特征存在于特定集合中,而空心星形表示其不存在。
我们可以假设(如果需要的话)总是存在至少一个具有该特征的全集实例(例如,标有较厚红包的实例)。
。这是因为子集(A,B,C,D,E)的任何实例同时是(A,C,E)的实例,但对于较窄的(A,C,E),我们可以有更多实例。
在本说明书中,我为每个子集类型使用六个实例,因为图片的空间有限,而这六个实例旨在反映具有和缺少该特征的实例之间的总体比例。
此外,将A与E或C与E合并不会产生额外的联合效应,因此E本身对整体效果的贡献很小。
尽管如此,如第二个图所示,E必须触发全部潜力并在第五个实例中显示该特征。
综上所述,我想从数据中推断出哪一个对象有利于特征外观。在我们的例子中,我们可以清楚地看到A和C非常有利(与其他人合作),E不是那么有用,但需要达到最大潜力,而B和D似乎对该特征没有合作效应。
你知道我怎么能推断出这样的贡献?