你的问题有点模糊,但我会尽我所能。
你的教授正在朝着正确的数学方向前进,但我认为你要求的是更完整的形式化。
任何游戏都可以被认为是树(即非循环图)。所以为了回答关于轮流的第一点,你可能会想到一个函数,它将树的节点映射到一些$ i \ in \ {1,2,... n \} $在下图中,你可能是能够定义一个公式来表征转弯,但你不一定能做到这一点。在此示例中,$ P_1 $和$ P_2 $采用交替顺序转弯。 $ P_1 $可以选择$ L $或$ R $,然后$ P_2 $可以看到他选择的,然后还可以选择$ L $或$ R $。
在继续你的第二点之前,我需要花一点时间来定义信息集,这听起来不像你已经到了。通俗地说,信息集是一组代表不确定性的顶点。例如,游戏树的根始终是单例信息集。考虑你和我同时选择正面或反面的游戏。当$ P_2 $选择是否打头或尾时,她不知道我是否选择了头或尾。因此,虽然游戏树将有3个内部顶点(1个是$ P_1 $的根,2个是$ P_2 $,反映$ P_1 $的选择),只有2个信息集,因为$ P_2 $的两个顶点都将包含在同一个信息集中。在轮流顺序的游戏中,所有信息集应该是单身。
现在回到你关于策略的问题。每个玩家都有一套策略。在上面提供的示例树中,$ S_1 = \ {LLLLL,LLLLR,...,RRRRR \} $。这看起来有点令人困惑,因为似乎$ S_1 $的每个元素都超出了定义路径的范围。每个玩家的策略都是根据信息集来定义的。因此,元素$ LLLLL $应该被读作,当$ P_1 $发现自己在顶部时,她将选择$ L $,当她发现自己处于左边最远的顶点和顶部的1个顶点时,她还会选择$ L $。然后它还说如果$ P_2 $选择$ R $,那么$ P_1 $将选择$ L $。因此,策略是玩家在所有可能的突发事件下可能采取的所有可能行动的集合。
最后,我们如何说明从策略到支付的映射?首先我们注意到玩家有一个策略集$ S_i $,然后形成笛卡尔积$ S = S_1 \次S_2 \ times ... \次S_n $,它表征所有可能的玩家所有可能的策略组合。那么我们的收益将是$ \ pi:S \ to \ mathbb {R} ^ n $。在我们的示例中,$ \ pi(LLLLL,LLLLLLLLLL)=(4,2)$。