对于公司 A/公司/巨人公司/“大型制药公司” /“ THE MAN”,策略从对称版本不变:
考虑一个回合,在此回合中仅看到较少候选人的概率为 >.5。如果公司A 留住候选人,然后就有机会获胜 >.5。如果A 没有保留候选人,然后是公司 B 可以雇用候选人和公司 A 有机会中奖 <.5。所以,显然,公司A 会雇用(和公司 B 在这种情况下会尝试雇用)。
对于获胜几率完全相同的候选人 .5, A 可能会或可能不会选择雇用,但是 B 会选择雇用,因为 B 永远不可能比 .5。
如果公司 A 在看到有机会获胜的候选人之前被雇用 >=.5,那么存在更好的未来候选人的可能性(因此 B 获胜)将 >.5。所以A 在看到有可能赢得赔率的候选人之前不会雇用 >=.5。
因此, A的策略与对称情况相同:雇用第一个产生胜算的候选人 >.5。
B的策略是 A的策略 显然,如果A 在(之前或之前)雇用 B, 然后 B公司的策略是雇用下一个比 A的,如果有的话。此外,如果候选人的获胜赔率是>.5, B 应该尝试雇用,即使 A 也将尝试雇用(并强迫 B 继续寻找)。
剩下的唯一问题是:它是否有益于 B 在获胜的机率是 <=.5。答案是:是的。
直觉上说,有一轮,与候选人获胜的几率是 .5−ϵ。另外,“很有可能”(稍后解释)获胜赔率的未来候选人>.5+ϵ。那会受益B 选择较早的候选人。
让 dr 成为全面面试的候选人 r 对所有人 1<=r<=N。
正式, B的策略是:“雇用 dr 如果这样做的话,胜出的机率要比没有。”以下是我们如何计算这样的决定的方法。
让 pr,i 是面试和录用后中奖的概率 dr 给定 dr 是个 i最佳面试候选人。然后:
pr,i= 的可能性 ds<dr 对于 s>r
=(1−ir+1)(1−ir+2)×...×(1−iN)
...
=(N−i)!r!(r−i)!N!
尤其是 pr,i 可以很容易地计算出恒定的精度。
让 PB,r 成为 B 胜诉,因为两家公司都没有聘用 1 通过 r−1。
然后 B 会雇用 dr 如果录用后有中奖的可能性 dr 胜过 PB,r+1。
注意 PB,N=0,因为如果是最后一轮,那么 A 保证雇用和 B 不会雇用任何人而松散。
然后,在圆 N−1, B 保证会尝试雇用,除非会成功 A雇用。所以:
PB,N−1=∑i=1N−11N−1{pN−1,i1−pN−1,i::pN−1,i<.5pN−1,i>=.5
这导致了递归函数:
PB,r=∑i=1r1r⎧⎩⎨⎪⎪1−pr,ipr,iPB,r+1:::pr,i>=.5PB,r+1<pr,i<.5else
很明显 PB,r可以在多项式时间内计算出恒定的精度。最后一个问题是:“B 赢了吗?”答案是 PB,1 并随 N。
关于多久一次的问题 B赢得?我还没有精确计算,但是看着N 从1到100,似乎 N 成长, B的获胜率接近.4左右。由于我只是做了一个快速的python脚本来检查并且没有密切关注浮点数舍入错误,所以此结果可能会关闭。最终的实际硬限制为0.5可能很好。