我有一些团队得分的电子表格。一线队以10分获胜。每队有2名球员。尽管并非是随机选择的,但玩家始终与不同的队友一起玩。不保留任何个人分数。
所以基本上我们有Bill和Bob击败Andy和Alice 10-4 Jake,而Bill击败Joe和John 10-8 ...
根据所有可用的比赛数据,是否有可能为各个球员得出一些排名。基本上,要了解每个玩家对每个游戏的贡献或相对于其他玩家的贡献是多少?
我有一些团队得分的电子表格。一线队以10分获胜。每队有2名球员。尽管并非是随机选择的,但玩家始终与不同的队友一起玩。不保留任何个人分数。
所以基本上我们有Bill和Bob击败Andy和Alice 10-4 Jake,而Bill击败Joe和John 10-8 ...
根据所有可用的比赛数据,是否有可能为各个球员得出一些排名。基本上,要了解每个玩家对每个游戏的贡献或相对于其他玩家的贡献是多少?
Answers:
以下是几个非常简单的模型。它们都至少在某种程度上存在缺陷,但是也许它们会提供一些基础。第二个模型实际上并不能(完全)解决OP的情况(请参阅下面的评论),但是我保留它是为了以某种方式提供帮助。
模型1:Bradley–Terry模型的变体
假设我们主要希望根据每个团队的球员来预测一个团队是否会击败另一个团队。我们可以简单地记录每场比赛的球员团队1击败球员团队2 ,而忽略最终得分。当然,这会丢弃一些信息,但是在许多情况下,这仍然提供了很多信息。(k ,ℓ )
然后,模型为
也就是说,我们为每个玩家提供一个“亲和力”参数,该参数会影响该玩家提高其团队获胜机会的程度。通过定义玩家的“力量” 。然后,该模型断言 P(组1次小组2 )= s ^ 我小号Ĵ
这里有一个很好的对称性,即只要响应与预测变量一致,响应的编码方式都无关紧要。也就是说,我们还有
这可以很容易适应的回归与正在采取的值(每个玩家一个)指标预测如果球员是在1队有问题的游戏,,如果她在队2和,如果她不参加那场比赛。我- 1 0
因此,我们也为球员提供了自然排名。较大的(或),更大的球员提高自己球队的胜算。因此,我们可以简单地根据玩家的估计系数对其进行排名。(请注意,亲和力参数只能在公共偏移量之前进行识别。因此,通常将固定为可识别的模型。)小号α 1 = 0
模式2:独立评分
注意:重新阅读OP的问题后,显然以下模型不足以适合他的设置。具体来说,OP对一场比赛感兴趣,这场比赛在一个团队或另一支球队获得固定分数后结束。以下模型更适合于具有固定持续时间的游戏。可以进行修改以使其更适合OP的框架,但是需要单独的答案来进行开发。
现在我们要跟踪分数。假设这是一个合理的近似值,即每个团队彼此独立地得分,并且在任何间隔内获得的得分数与任何不相交的间隔无关。然后可以将每个团队得分的分数建模为泊松随机变量。
请注意,该模型忽略了团队之间的实际对决,仅着眼于得分。
计分在此模型中仍然是独立的,但是现在每个团队中的球员之间都有相互作用,这会影响得分。玩家也可以根据他们的亲和力系数进行排名。
模型2(及其变体)也可以预测最终分数。
扩展:扩展两个模型的一种有用方法是合并排序,其中积极指标对应于“主队”,而消极指标对应于“客队”。然后,将拦截项添加到模型中可以解释为“主场优势”。其他扩展可能包括在模型1中合并联系的机会(实际上在模型2中已经存在这种可能性)。
旁注:在美国大学橄榄球碗锦标赛系列赛中,至少有一项计算机化民意测验(彼得·沃尔夫的测验)使用(标准)布拉德利-特里模型来产生排名。