人工智能 control-theory

什么时候应该使用强化学习与PID控制？

在设计诸如OpenAIGym上的Lunar Lander之类的问题的解决方案时，强化学习是一种诱人的方法，可为特工提供足够的动作控制以使其成功着陆。但是，在什么情况下，控制系统算法（例如PID控制器）可以很好地完成强化学习（如果不是更好的话）呢？诸如此类的问题这一个做的是解决这个问题的理论非常出色，但无助于解决实际分量。作为一名人工智能工程师，问题领域的哪些要素应该向我建议PID控制器不足以解决问题，而应改用强化学习算法（反之亦然）？

12 reinforcement-learning ai-design control-theory

Questions tagged «control-theory»