第一本人工智能中学教材来了!《人工智能基础(高中版)》编著历程

2018年4月28日,华东师大逸夫楼。

礼堂里座无虚席,大家翘首以待 。随着舞台上的“书”被翻开,全球首部专为中学教学编写的人工智能教科书终于面世了。对于参与编写的每一个人来说,这是一个值得向至亲分享的时刻。

这部教科书的影响与意义也许需要更长的时间才能看清楚。但是,一群年轻人在一起去完成一件前人没有做过的事情,这样的经历肯定是值得铭记的。本文记述了这段充满挑战的历程,以及教材编写中的几次关键选择。

“这是一个开创历史的机会”

2017年9月,在一次研究会议后,我收到海龙(尚海龙,商汤科技香港公司总经理兼教育事业部总经理)的电话。他提到商务印书馆希望和商汤合作编写一部中学版人工智能教材。不久后,汤老师(汤晓鸥,商汤科技创始人,香港中文大学信息工程系教授)也找到我商量编写教材的事情。这让我感到非常意外,也非常纠结。一方面,教科书的编写对我而言是一项全新的工作,我没有任何经验;另一方面,实验室的各项研究正在进入关键阶段,哪有余力开展这样一个大项目呢。可是,汤老师的一句话给了我很大的影响。

“人工智能进中学教材,这是历史上第一次。这是一个开创历史的机会。”  

确实,这样的机会是难以抗拒的。一番天人交战后,跃跃欲试的雄心战胜了对困难的顾虑,我接下了这个任务。

艰难的开始

10月10日,第一次教材工作会议在上海举行。商务印书馆,华东师大慕课中心,以及商汤的同事在华东师大商讨教材的编写计划。主持会议的是陈玉琨教授。陈教授已经在基础教育耕耘数十载,桃李满天下,在教育界威望极高。我刚到会议室,陈教授主动起来到门口欢迎,这份尊重和礼遇让我颇为感动。

可是,接下来的会议并不顺利。

在会前,我准备了一份关于教材的大纲 — 那基本是大学机器学习教材的简化版。这份以知识为导向的大纲列出了我认为需要讲授的基础知识,包括分类,回归,无监督学习,和增强学习等方向。这份大纲在会上受到了上海的中学老师们礼貌却又强烈的批评。大家认为,这些知识点过于艰深,根据这样的大纲编写的教材是无法在中学课堂讲授的。有部分老师提出,教材可以以科普为主,主要介绍基本概念和展示应用,不涉及背后的数学和算法。对于这种方式,我不能认同 — 这和参观展览馆有什么不同?

这次会议上的争论让我认识到人工智能研究和基础教育之间横亘着一道鸿沟。要把人工智能的知识和理念传递给中学的同学们,需要在鸿沟上架设一座桥梁。这是一个巨大的挑战,也是我们工作的意义所在。

会议开了整整一天,从早上9点到下午5点。经过反复深入的沟通,双方在教材设计原则上达成了基本共识:

  • 中学人工智能教学的目的不是把所有同学培养成人工智能专家,而是传递人工智能的基本思想和理念,培养动手能力和创造力,使得同学们在以后进入各行各业能自觉运用人工智能解决问题。

  • 兴趣与知识并重。通过生活中的应用发展同学们对人工智能的兴趣,并由此引入适合中学生接受的基础知识和基本算法。

  • 以实践为导向。在每个章节,以具体的应用为主线,把相关知识贯穿起来。为教材提供配套的实验平台和任务包。


这次会议的另一个重要成果是把团队建立起来,并确立了在编写过程中的合作方式。具体来说,就是商汤科技和香港中文大学的团队负责教材专业内容的设计和撰写,由上海六所重点中学老师组成的团队负责从教学的角度提出反馈并对教学语言的运用提供指导意见。最后双方合作统稿。

从0到1

从上海回来后,我开始拟定教材的大纲。大纲的设计思路源于海龙提出的八个字:“耳聪目明,心灵手巧”。最初的大纲把教材分为七个章节。

  1. 总论:人工智能概述

  2. 经典图像分类(目明)

  3. 深度学习(目明)

  4. 音乐风格分类(耳聪)

  5. 相册聚类

  6. 自然语言理解(心灵)

  7. 生成模型(手巧)


从机器学习的角度,这个大纲涵盖了三种重要的学习方式:监督学习(第2 - 4章),非监督学习(第5 - 6 章),和生成模型(第7章)。在实验室其他教授的支持下,我在实验室内部组建了编写团队。第一章总论由我自己撰写,其余六章各由一位实验室的同学负责。他们根据我发出的每章细则来进行具体的内容编写。汤老师指出,这部教材的编写是开创历史的工作。因此,我们在教材编写之初就订立了一条铁律。

坚持原创。
每一段话都必须自己撰写,
每一幅教学示意图都必须自己设计。

从10月中开始,同学们就开始了各自的编写工作,在这个过程中,我们和上海的老师们保持了密切的沟通。2018年1月15日,教材的初稿完成。

波澜再起

1月20号,由商汤团队和上海老师参与的全体会议再次举行,集体对初稿进行审议。

初稿的完成使大家备受鼓舞。可是,随着会议的进行,我们发现有点高兴得太早了。在这次会议上,波澜再起。双方争论的焦点落在了第二章(经典图像分类)和第三章(深度学习)。这两章是全书的知识基础,它们的成败决定了全书的成败。虽然负责这两章的编委付出了很大的努力以尽可能通俗的方式讲授,可是效果还是不能令人满意。

什么是数据?什么是特征?什么是权重?什么是卷积?

参与审稿的老师们在会议上直言指出,初稿中对这些最基础的概念没有讲清楚。编委们在日常的研究工作中对这些非常基本的名词可以说是习以为常,可是真要向零基础的同学讲清楚它们的涵义却并不容易。两个多月辛苦得到的是尖锐的批评。今天回想起来,我依旧能感受到编委同学在当时的苦闷和委屈。可是,一部高质量的教科书,不经锤炼又如何能出来呢。

在会议上,老师们还指出,第二章一下子引入了太多基础概念,担心同学们难以接受,希望把众多概念在全书中循序渐进地展开,让学习曲线变得平缓一点。要实现这一点意味着第二章和第三章整个需要推倒重来,重新设计。

会议结束后,我让相关的编委组成攻关小组重新设计编写这两个基础章节,并且把我的一个博士后研究员王若晖调进来支援这项任务。在新的设计中,我们调整了章节内容:在第二章只讲模式识别的入门知识和基本的分类器,使用的应用例子改用可以直观说明的简单属性特征,并把图像处理的知识移到第三章,从而降低了第二章的概念密集度。在第三章中把图像滤波的知识和卷积特征提取进行有机融合,使得对卷积的介绍获得更具体的应用背景支撑。此外,大家还一起对所有的基本概念以及它们的衔接关系进行梳理,并且在教材中加入大量具体的例子和图表,让读者可以更形象地理解它们。这些工作取得了明显的成效,后来参与审稿的同事和老师都表示新修订的章节更容易读懂了。

第三章的修订过程中,编委们对于如何处理生物神经网络和人工神经网络的关系也进行了深入讨论。传统的神经网络大学教材往往是从生物神经网络说起,然后引入人工神经网络。我们认为这种讲授方式很容易让读者产生“仿生学”的联想,这显然是不科学的,也不符合现代主流的设计和研究思路。讨论后,我们决定依照当代研究领域的主流观点,主要从特征学习的角度讲述卷积神经网络的意义,淡化它和生物神经网络的联系,以避免读者形成不恰当的理解。

争分夺秒,二度大改

2月初,对初稿的修订完成后,我把第二稿发给汤老师重新审阅。汤老师看过后,认为仍然有很大的改进空间,并提出了三个重要的意见:

  1. 这一稿在图文并茂上仍然不足,需要提高插图的数量和质量。

  2. 加入视频理解和AlphaGo相关的章节,这代表的人工智能发展的新高度。

  3. 科普部分需要加强,不仅要讲好基础知识,对于人工智能的最新发展也要进行概要性的介绍,培养同学们对人工智能更大的兴趣。


实施这些意见对于提高整个教材的水平是十分有帮助的。可是,这时候离原定四月份的发布时间只剩下两个月了,还来得及吗?为了做出决定,我给乔宇,海龙与戴娟打了电话,寻求他们的意见,都得到了坚决的支持。我们决定,拿出商汤使命必达的决心,把我们的教材打造成一部精品。于是,公司和各联合实验室更广泛地动员起来:各联合实验室再调集五位博士加入编委团队,商汤设计部调来了三位设计师加班加点为教材制作插图,研发,工程,和商务团队的多位同事参与审阅和提出修订意见。参与教材相关工作的同事和同学迅速增加到接近三十人。

2月25号,全体会议又一次在上海举行。除了原编委团队外,多位新加入的商汤同事以及华东师大出版社的同仁也出席了会议。会议进行了一天,逐个章节进行审议。这次会议进展比较顺利,第三稿终于得到了老师们和出版社的认可。会议决定,抓紧时间根据会上提出的具体建议进行最后修订,在3月5日定稿交付出版。

付梓前后

虽然2-25会议决定基于第三稿进行最后定稿,但是编委们都明白,这只是确定了结构和内容,但是这一稿在图文细节上还存在很多问题。行百里者半九十,我们必须在细节上精益求精,才能打造出一部让我们引以为豪的教科书。

从2月26号到3月5号的八天时间里,整个编委团队处于冲刺状态,为教材的定稿日夜不息地进行最后的努力。每一个章节都会有三位编委进行交叉检验,再交到我手上审阅。我们仔细检查了每个知识点,每个公式,每个图表,对不满意的表述反复讨论修改,对不满意的图表重新进行制作。

3月6日凌晨3点,我们把第四稿作为定稿发给了出版社。

定稿交付后,我对比了第三稿和第四稿,虽然内容结构没有重大变化,但是很多段落都经过了重写,大部分图表都被重新绘制,整部教材再一次脱胎换骨。定稿交付了,可是编委们似乎并没有特别高兴。大家觉得这个交付的稿子是有遗憾的 -- 很多地方其实可以做得更好,但是来不及在deadline前完成了。

我们不甘心留下遗憾。

在和出版社的交流中,我们发现还有一次修订的机会。按照一般的出版流程,出版社在排版完成后,会把排好版的书稿发给我们,并给我们三天时间校验,在书稿上标示出需要修正的地方。于是,定稿交付后,我们继续进行未竟的修订工作,并把后补的修订一处处记录下来。最后修订完成时,我们在第四稿上又进行了一千多处局部修改。3月下旬,出版社给我们发来了排好版的书稿,我们在三天内把这一千多处修改逐一标示在书稿上。

收到我们的反馈后,出版社震惊了。他们说,排版要重做了……

发布

4月25日,在商汤AI大会上,同事晓菊把一本出版社印好的教材交给我。我翻着书,眼前浮现的都是这大半年来艰辛的编写历程,书中的内容却没有仔细看进去了。海龙说,这是“十月怀胎,一朝分娩”的感觉。

4月28日,华东师大逸夫楼,在多位领导,上百位重点中学校长,以及各方媒体的共同见证下,全球首部中学版人工智能教材发布。

全书共有九章:

第一章. 人工智能:新时代的开启

第二章. 牛刀小试:察异辨花

第三章. 别具慧眼:识图认物

第四章. 耳听八方:析音赏乐

第五章. 冰雪聪明:看懂视频

第六章. 无师自通:分门别类

第七章. 识文断字:理解文本

第八章. 神来之笔:创作图画

第九章. 运筹帷幄:围棋高手


知乎问题:

首部人工智能基础教材在上海发布,全国 40 所高中将开设 AI 课,AI 从娃娃抓起将产生哪些影响?


知乎用户-林达华答案:

作者:林达华
链接:https://www.zhihu.com/question/275285509/answer/383137673

谢谢大家对这部教材的关注。作为执行主编,我负责组建了商汤这边的教材编著团队,并参与了教材编著的整个过程。为了这部教材,商汤科技以及港中文实验室还有其他兄弟实验室先后投入了十几位博士。商汤的研发,工程,和设计部门都被动员起来参与全书的设计和审阅。前后历时八个月。我写了一篇文章记述了这个过程:迈出第一步: 《人工智能基础(高中版)》的编著历程

下面,我就大家讨论比较多的一些问题分享一下。


这部教材的目标

人工智能的掌握和理解是有多个层次的:

  1. 对人工智能的基本概念有所了解。

  2. 了解人工智能的基础知识和常用算法,从而可以运用它们解决工作中的问题。

  3. 深入理解人工智能的模型和算法,能做出数学模型,算法,或者工程实现上的改进和创新。

  4. 站在领域发展的前沿,在某些方向上引领领域的发展。


对于大部分中学同学来说,他们的最终职业道路可能不是成为AI的研究者或者工程师,而是进入其它行业。在AI应用日趋广泛的今天,相信很多不同行业都将受益于AI的赋能。因此,我们的高中教材主要是为了实现第二层次的目标。它着重于AI的基本思想,基础知识,以及常用算法和工具的讲授。中学同学通过对这个教材的学习是可以具备AI应用的基本能力的。


从培养未来从事AI研究的人才的角度来说,这个教材肯定是不足够的。但是,对于有志于AI研究的同学,这个教材也能为他们进一步的学习打下一个良好的基础。

当然,每个人成长的道路是不一样的。虽然学习AI会对很多工作有帮助,但我认为目前AI还不宜列为必修课程。在这个阶段,把AI引入高中作为选修课程或者兴趣课程是非常有意义的第一步。


关于数学基础

很多朋友可能会担心中学生是否具备必要的数学基础,这其实也是我们刚开始这个工作时的担心。但是,我们在对各种概念和知识进行梳理的时候发现,要实现上述的目标并不需要很深的数学。我们在教材中补充了必要的数学介绍(比如向量的基本运算,简单概率,和初级的优化思想),就能满足中学教学的需求了。



又比如我们也仔细讲解卷积的运算:


再举个例子,我们在第二章会讲到支持向量机(Support Vector Machine)。通常,在大学机器学习教科书里对这个topic的讲授会涉及到带约束的凸优化方面的知识,这显然是超出一般中学数学水平很多的。我们在讲这个topic的时候,着重于讲解 large margin 对分类器推广性能的意义,以及为了达到目标所建立的损失函数。而涉及到更深的优化理论的部分则会略过。这样学生在没有学过很深的数学的情况下,就可以基本理解SVM的用处,了解如何把一些简单的intuition转化为数学模型,并开始应用这个工具去解决实际问题。


(后面还会有如何把最大间隔的intuition转换为目标函数的讨论,限于篇幅,这里暂不贴出来)


实践动手的机会

AI是一门应用性非常强的学科,动手实践是必不可少的。我们期望学习过这门课程的同学是能写出不太复杂的AI应用程序的,而不仅仅停留于概念了解。

在教材编写之初,我们就确定了以任务包为主线的编写思路。除了第一章的概述之外,其余各章都会通过一个主线任务来引导学生学习相关知识。在这种编写方式下,知识的介绍是有具体的应用任务为背景的。学生在学习的过程中会了解为什么需要学习这些知识,也能理解到这些知识怎么应用到实际问题中去。

看过教材的朋友都会发现,每个小节都配有一些练习和实验。把一章中的实验完成了之后,一个简单的应用任务也就完成了。



为了配合教材中的22套实验,我们还开发了一个配套的教学实验平台。在这个平台里,我们对多种常用的算法进行便于中学生进行实验的API设计和封装,配套的数据集也做了适当的剪裁,尽可能使得普通的中学生能在可以接受的时间里能够完成实验。在这个平台上,我们选用了在AI领域最广泛使用的Python语言。我们为合作学校提供了多方面的支持,包括教学平台的支持,老师的培训等等。



教育不平衡的担忧

很多朋友担心,基于开展AI教学的重点中学会获得比普通中学更进一步的优势,使得教育不平衡进一步加剧。


对于这个问题,我的看法是:这部高中版AI教材的出版,可以让更广大的学生群体在中学阶段就了解和接触人工智能,使得中学AI教学不再是个别重点中学的专利。

在过去一年,我和我的同事走访了全国多所重点中学。我们发现,很多中学在AI教育方面其实已经走在了前列。一些中学的计算机或者信息方向的老师是发过多篇顶会paper的名校博士,并且已经在校内开设了AI相关课程。一些特别优秀的高中生已经在著名的AI公司实习,并向CVPR等会议投稿。汤晓鸥教授和我去清华做报告的时候,就有人大附中的同学来听报告,并且提出了关于概率图模型方面的问题。显然,在这些名校学习的学生能更早接受优良的AI教育。他们在进入大学学习后,会有比同龄人更高的起点。


这部教材的出版(售价35元),以及它配套的教学实验平台,可以有助于本已在少数名校中开展的AI教育推广到更多的中学(我们已经在这么做了),让更多的同学在中学阶段就接触到AI的思想和基础知识,在未来更好地适应人工智能技术被普遍运用的社会。


来源:知乎 -林达华,迈出第一步: 《人工智能基础(高中版)》的编著历程,专知已获得作者授权。

https://zhuanlan.zhihu.com/p/36415773

首部人工智能基础教材在上海发布,全国 40 所高中将开设 AI 课,AI 从娃娃抓起将产生哪些影响? - 林达华的回答

https://www.zhihu.com/question/275285509/answer/383137673

-END-

专 · 知

人工智能领域主题知识资料查看与加入专知人工智能服务群

【专知AI服务计划】专知AI知识技术服务会员群加入人工智能领域26个主题知识资料全集获取

点击上面图片加入会员

请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料

请扫一扫如下二维码关注我们的公众号,获取人工智能的专业知识!

点击“阅读原文”,使用专知

展开全文
Top
微信扫码咨询专知VIP会员