这个最近的博弈论问题让我思考(当然是切线):是否有可能有效地优化个人策略,以选择研究问题以运用博弈论进行研究?
为了使问题正式化,我将作以下(非正式陈述的)假设:
- 我同样“喜欢”我可以解决的任何特定问题(以避免“做自己喜欢的事情”的“软”(正确)答案)。
- 对于我选择要解决的任何给定问题,我可能会成功,也可能不会成功。对于任何给定的问题,我都会估算出解决问题的能力(在投入时间之后)的概率。
- 我的目标是在进行线下评估(申请工作,申请终身任职,申请研究金等)时,最大程度地提高我的回报,这取决于我解决了多少个问题以及这些问题的重要性或难易程度。我不清楚每个问题的确切收益,但我可以做出合理的估算。
- 问题收益与问题难度之间存在松散的逆关系。我的目标的另一种说法是“博弈”差异(即寻找“低落的果实”)。
- 这个整体问题的一个实例由一系列研究问题(可能是无限个)指定,我将其牢固地附加(不计任何计算成本;作为输入给出)对问题价值和问题难度的估计。我正在与对手(评估我的人)进行游戏;考虑到我解决给定问题的可能性,自然决定了在选择尝试后是否能够成功解决问题。
为了真正形式化正在发生的事情(避开无趣的或争论性的/讨论式的回应),我将把这个问题看作是一种形式广泛的游戏,其中包含不完整的信息以及无限的动作集。
问题:我认为这类游戏无法有效计算。但是,是否有多项式时间算法可以使我的收益最大化?PTAS呢?
或者,是否存在针对此问题的更准确的博弈论模型?如果是这样,则存在相同的问题:我可以(大约)有效地最大化收益吗?如果是这样,怎么办?