您需要一个概率模型。
排名系统背后的想法是,一个数字足以说明玩家的能力。我们可以将此数字称为“强度”(因为“排名”已经意味着统计中的特定内容)。我们可以预测,当强度(A)超过强度(B)时,玩家A将击败玩家B。但是这个陈述太弱了,因为(a)它不是定量的,并且(b)它没有考虑到弱者偶尔会击败强者的可能性。我们可以通过假设A击败B的可能性仅取决于其优势的差异来克服这两个问题。 如果是这样,那么我们可以重新表达所有必要的优势,以便优势之差等于获胜的对数赔率。
具体来说,这个模型是
升ø 克我吨(镨(甲 节拍 乙))= λ一种- λ乙
根据定义,其中是对数赔率,我为玩家A的实力写了,。λ 甲l o g i t(p)=对数(p )- 对数(1 − p )λ一种
该模型具有与参与者一样多的参数(但自由度要小一些,因为它只能识别相对强度,因此我们可以将参数之一固定为任意值)。它是一种广义线性模型(在二项式族中,具有logit链接)。
可以通过最大似然估计参数。相同的理论提供了一种在参数估计值附近建立置信区间并检验假设的方法(例如,根据估计值,最强的参与者是否比所估计的最弱的参与者强得多)。
具体来说,一组游戏的可能性就是乘积
∏所有游戏经验值(λ优胜者- λ失败者)1 + 经验(λ优胜者- λ失败者)。
固定的值后,其他值的估计值就是使这种可能性最大化的值。因此,改变任何估计值都将减少其最大值的可能性。如果减少太多,则与数据不一致。通过这种方式,我们可以找到所有参数的置信区间:它们是限制,在这些极限中,更改估计值不会过度降低对数可能性。可以类似地检验一般假设:假设限制了优势(例如假设它们都相等),此约束限制了可能性的大小,如果此限制的最大值与实际最大值相差太远,则该假设为拒绝。λ
在这个特殊问题中,有18个游戏和7个免费参数。一般而言,参数太多:灵活性太大,可以在不改变最大可能性的情况下自由地更改参数。因此,应用ML机器很可能证明是显而易见的,这是因为可能没有足够的数据对强度估计值有信心。