强化学习怎么入门好?

最近在做一个跟强化学习有关的项目,在csdn等网站上了解了MDP,值函数等基本知识,接着学习Q学习、Sarsa等算法,但是感觉有些囫囵吞枣,有没有比较…
关注者
3,055
被浏览
2,270,792
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

我在几年前开始自学RL,我的感觉是RL远比统计机器学习、深度学习难学。我是从Rich Sutton的书开始入门的,后来觉得我绕了远路。Sutton的书确实是经典,但对初学者不友好,而且有old-school的感觉,书中很多内容今天用途不大,而当今最有用的知识在书中讲的又不够。

有些其他的书绕开数学,乍看起来是捷径,但学完之后对学术没有任何帮助。想学好RL就不该躲开数学,而是应该理解数学公式的意义。所有RL方法都是从几个核心公式衍生出来的。彻底理解那几个公式,就能轻松看透一切套路。

对我来说,学习DRL的捷径是直接读论文,把当今最有影响力的DRL论文都看一遍,远比读Sutton的书有效率。但是这种方法只适合我这种有经验的researcher,而不适合初学者。

我在读书、读论文的时候做了很多笔记,后来在教学、写proposal的时候又不断梳理DRL的知识点,有了很多积累。我们把深度强化学习的基础、前沿梳理清楚,放在统一的框架内,用统一的语言和符号,写成了《深度强化学习》。如果对深度学习有一定的了解,那么阅读我们的《深度强化学习》不会有太大困难。看这本书,会比自己读论文要轻松,毕竟每一篇论文的语言风格、符号系统都是不一样的。

初稿已经写完了,现在还在做校对。目前书中错误还很多,而且每一遍校对都能发现很多错误。如果大家可以容忍错误,不妨下载看看。如果发现错误,或者有建议,请告知我,多谢!



写书的时候,我努力在通俗和严谨之间找平衡,在实用和学术之间找平衡。我认为最重要的是“说人话”,把数学和算法解释清楚,尽量降低门槛。为了把很多原理解释清楚,我花了大量时间画图,尽量让这本书看起来像是现代的书,而不是上世纪的书。





我们的书的目的是讲清楚DRL的原理,没有实现的代码。想读代码的可以看这本书:

Deep Reinforcement Learning Hands-On

这本书跟我们的书互补。这本书只有实现,几乎没有讲原理。

如果中国买不到,可以在 Library Genesis 上下载到电子(dao)版(ban)。