这是一门面向高阶研究的课程,主要讲授大语言模型(Large Language Models, LLMs)的基础知识,包括语言模型的架构设计与训练框架,以及 LLM 的能力、应用场景与相关问题。课程将结合最新研究动态,讲解并讨论关于大语言模型的前沿论文。 先修课程要求:学生需具备机器学习相关知识背景(如已修 CSE 417T/517A)。