MIT强化学习最新更新版【548页PDF下载】- 专知

MIT强化学习最新更新版【548页PDF下载】

【导读】强化学习是人工智能中最活跃的研究领域之一，是一种计算学习方法，通过这种方法，Agent试图在与复杂，不确定的环境进行交互时最大限度地获得奖励。在强化学习中，理查德萨顿和安德鲁巴托提供了关于强化学习的关键思想和算法的清晰而简单的说明。他们的讨论范围从该领域的知识基础的历史到最新的发展和应用。唯一必要的数学背景是熟悉概率的基本概念。

本书分为三个部分。第一部分根据马尔可夫决策过程定义强化学习问题。第二部分提供了基本的解决方案：动态规划，蒙特卡罗方法和时差学习。第三部分提出了解决方法的统一视图，并结合了人工神经网络，资格跟踪和规划;最后两章介绍了案例研究，并考虑了强化学习的未来。

请关注专知公众号（扫一扫专知二维码，或者点击上方蓝色专知），