1
什么时候应该使用强化学习与PID控制?
在设计诸如OpenAIGym上的Lunar Lander之类的问题的解决方案时,强化学习是一种诱人的方法,可为特工提供足够的动作控制以使其成功着陆。 但是,在什么情况下,控制系统算法(例如PID控制器)可以很好地完成强化学习(如果不是更好的话)呢? 诸如此类的问题这一个做的是解决这个问题的理论非常出色,但无助于解决实际分量。 作为一名人工智能工程师,问题领域的哪些要素应该向我建议PID控制器不足以解决问题,而应改用强化学习算法(反之亦然)?