这本书的一个关键结构特点是其模块化的组织方式,旨在提供灵活性,以便根据课程内容的变化进行调整和修改。具体来说,全书分为两个部分: (1)基础平台:包括第1章。该章节对近似动态规划(DP)/强化学习(RL)领域进行了有选择性的概述,为课堂中其他RL主题的更深入讲解提供了起点,而这些主题的选择可以由授课教师灵活决定。 (2)深入探讨部分:包括第2章和第3章,主要聚焦于具体方法的详细介绍。第2章主要讲解确定性与随机性 rollout 技术,以及一些相关的价值函数近似方法;第3章则讨论了在离线训练中使用神经网络及其他近似结构的技术。 这种模块化结构允许教师根据课程重点进行个性化定制。例如,教师可以利用第1章的基础平台来构建更偏数学理论或更偏实用导向的课程,以满足不同学生的需求。 此外,还需指出的是,本书所包含的内容超出了一个学期课堂教学所能覆盖的范围,这为授课教师在教学内容选择上提供了更多灵活性。
这是一本关于自由概率论的导论性材料,涵盖了其基础的组合理论与解析理论,同时也介绍了自由概率与随机矩阵和算子代数之间的联系。本讲义的内容主要基于讲授者的两部著作:一部与 Nica 合著 [NSp],另一部与 Mingo 合著 [MSp]。 本系列课程中,自由概率仅限于标量值情形的讨论;关于算子值自由概率的内容将在后续题为《非交换分布》的课程中讲授。 本课程于2018/19 年冬季学期在**德国萨尔兰大学(Saarland University)**开设,共计 26 讲,每讲 90 分钟。课程全程录像,现已公开,可通过以下链接观看: