【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

人类从反馈中学习得最好——我们被鼓励采取导致积极结果的行动，而被具有消极后果的决定所阻碍。这种强化过程可以应用到计算机程序中，使它们能够解决经典编程所不能解决的更复杂的问题。深度强化学习实战教你基本概念和术语的深度强化学习，以及实践技能和技术，你将需要把它落实到你自己的项目。

对这项技术

深度强化学习是一种机器学习的形式，人工智能智能体从自己的原始感官输入中学习最优行为。系统感知环境，解释其过去决策的结果，并使用这些信息优化其行为以获得最大的长期回报。众所周知，深度强化学习对AlphaGo的成功做出了贡献，但这并不是它所能做的全部!更令人兴奋的应用程序等待被发现。让我们开始吧。

关于这本书

深度强化学习实战中教你如何编程的代理人，学习和改善的直接反馈，从他们的环境。您将使用流行的PyTorch深度学习框架构建网络，以探索从深度Q-Networks到策略梯度方法再到进化算法的强化学习算法。在你进行的过程中，你会将你所知道的应用到实际操作项目中，比如控制模拟机器人、自动化股票市场交易，甚至构建一个可以下围棋的机器人。

里面有什么