在玩了太多《愤怒的小鸟》之后,我开始观察自己的策略。事实证明,我开发了一种非常具体的方法来使每个级别获得3星。
这让我想知道开发一个能够玩《愤怒的小鸟》的机器学习系统所面临的挑战。与游戏互动并发射鸟类是微不足道的。但是我有一个问题是关于系统的“构建块”。
机器学习系统似乎可以使用简单的概念或对该问题的理解。这通常被编码为要素作为输入。因此,系统似乎需要具有理解一些高级概念以生成策略的能力。
这是真的?另外,开发这样的系统有哪些挑战或困难部分?
编辑#1:
这里有一些澄清。获得3星是一个难题,因为您必须最大化积分。这可以通过两种非排他性的方式来完成:1)最小化使用的鸟类数量(每只未使用的鸟类获得10,000分)。2)最大程度地破坏玻璃,木材和其他物体。每个被破坏的物体都会给你分数。一只鸟有可能摧毁价值超过10,000点的物体。
这是有关“高级概念”的更多解释。为了最大化上述点,您需要使用每只鸟的特殊能力。因此,这意味着根据地图的布局发射具有不同轨迹的不同鸟类。并且,在比赛时,我制定了一种策略,该策略以特定顺序摧毁某些鸟类。
似乎,如果不了解如何使用每只鸟来破坏特定区域,系统将无法学会获得3星。那么,您如何管理和编码类似的东西?您如何确保系统可以学习这些高级概念?