模型预测控制(MPC)和基于模型的强化学习(Model-based RL)之间的联系是什么?

最近在看模型预测控制相关的资料,突然觉得data-driven MPC和 强化学习理论中 Dyna-Q架构惊人的相似,这两种方法之间的区别和联系是什么…
关注者
266
被浏览
136,589
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

以下是来自悉尼大学 Prof Ian R. Manchester课程里的两张PPT,阐述了一些control和RL的关系: