首发于认知智能
万字长文,解读知识图谱在教育智能化中的应用

万字长文,解读知识图谱在教育智能化中的应用

最近几年来,我们复旦大学知识工场团队也一直在探索知识图谱在垂直行业中的应用。面向不少垂直行业,也接触过不少需求和项目。感触还是挺多的,一些在学术层面上看似已经解决了的问题,在实际场景中却不那么work了。领域应用还有一个重要的点是在于怎么去找跟业务的结合点,能在业务中发挥图谱的价值。这一点在实际落地中更加重要,如果项目本身的业务价值都不被决策者认可,那连接触困难问题的机会都没有。前一段时间,接触了一些教育相关的项目,所以结合团队的实践,来聊一聊知识图谱在教育智能化中的应用。

一 知识图谱及其应用价值

(一)知识图谱与认知智能

自2012年谷歌提出知识图谱到现在已经8年,在这8年里,随着数据科学的蓬勃发展,深度学习的广泛使用,人工智能技术也取得了飞速的发展。伴随着互联网,人工智能,5g等技术应用的逐渐成熟,人类社会已经开始进入智能时代。

智能化对机器的智能水平提出了要求,包括机器的计算智能、感知智能,以及机器的认知智能。认知智能是更高层次的智能,而让机器具备认知智能就是指让机器能够像人一样思考。这种思考能力具体体现在机器能够理解数据、理解语言进而理解现实世界的能力,体现在机器能够解释数据、解释过程进而解释现象的能力,体现在推理、规划等等一系列人类所独有的认知能力上。相较于感知能力,认知能力的实现难度更大,价值也更大。

认知智能与计算智能,感知智能

机器认知智的实现依赖的就是知识图谱技术,知识图谱为代表的知识工程的一系列技术,在认知智能的实现中起到非常关键的作用。

(二)知识图谱简介

知识图谱就是一种大规模的语义网络,是一种对现实世界的一种语义化的表示形式。把实体表示成节点,实体的属性,实体间的关系表示成边,构成了一个网状的图结构。这种结构化的形式人类可识别,对机器也很友好,方便机器理解。图谱中大规模的概念,属性,实体之间关系,让其具有丰富的语义信息,丰富关联信息,天然具有图的各种特征,可以进行图的相关操作与应用。构建之后也可以作为背景知识直接供下游应用使用。只是图谱起先是由谷歌提出,主要用于改善搜索引擎的能力,提高搜索质量。由于知识图谱独特的特征,让他能在人工智能的多个方面发挥重要的价值。

(三)知识图谱的价值

1.数据治理

把领域中异构的知识结构化,构建知识间关联。主要解决领域内数据分散在多个系统,数据多样、复杂,孤岛化,且单一数据价值不高的应用场景。很显然结构化的知识,天然的把领域知识做了显性化沉淀和关联。构建起来了一张图。可以利用原生图的特征,支撑数据的挖掘,分析。例如做社团发现,关联分析,源头追溯等应用。

2.使能机器语言认知

知识图谱有丰富的语义关系,概念,属性,关系等这些语义关系可以很好的应用到nlp相关任务上,例如分词,短语理解,文本理解等任务上。通过知识图谱可以让机器能更好的去理解自然语言,进一步的更好的理解用户的意图,文本的含义。在分词,语义理解,文本挖掘等基本nlp任务中,在用户画像,搜索,推荐,智能问答等系统级应用中都有很多的作用。

3.知识引导,解决问题

提供行业背景知识,做知识引导,解决行业智能化落地中的问题。垂直领域内的深度应用,比如智能客服系统,智能外呼系统利用知识图谱可以精准的回答用户的问题,可以进行复杂问题的回答。一些垂直行业内常用的传统专家系统,通过赋予他们一定的背景知识,可以很好的提升效果

4.知识图谱使能可解释人工智能

可解释,是强人工智能的一个重要特征。当前以深度学习模型为主的人工智能应用,虽然从结果上看效果还不错。但是模型本身就是一个黑盒的不具备可解释性,这就导致在很多需要有解释性的行业,没法使用复杂的深度学习模型。比如在司法领域,医疗诊断领域,金融领域某些场景。可解释性的应用也会很好的提升用户对系统的信任感,提升用户满意度。问答场景下,推荐场景下都可以加入解释功能。

5.知识推理

其他应用基于知识图谱的推理,综合利用图谱中的概念上下位关系、属性类型及约束、图模型中实体间的关联关系,结合业务场景定义的关系推理规则等。可以用来做一些不一致性检测、推断补全,知识发现,商品溯源,辅助推理决策等各类推理应用

知识图谱技术目前已经全面走向实际落地阶段,已经在很多的垂直行业有了相当让人惊喜的应用。在教育行业也有不少的应用,接下来就重点的聊一下,知识图谱在教育智能化中的应用。

二 教育智能化概述

(一)教育智能化行业背景

教育是一个国家发展的根本,国家需要教育来培养人才,促进国家的持续发展。教育行业根据受教育的人年龄层次,大概分为幼教,K12教育,高等教育,职业教育等多个细分领域。教育行业主要涉及3类用户需求:一类是教育者,对于他们来讲就是如何更好的去教学。一类是受教育者,对他们来讲就是如何更好的去学习知识。还有一类是管理者,如何更好的做管理运营。近些年随着教育信息化的不断推进,AI技术的广泛应用,5G网络技术的发展,也为教育行业带来了新的机遇。教育智能化也在国家政策层面,被提到了新的高度。

知识图谱在垂直行业的落地应用,不是一蹴而就的,还需要一些条件。那么教育行业是否具备智能化的条件呢?接下来主要从两个角度来回答一下这个问题。一个是行业内生的因素,整个教育智能化的行业大环境。 另一个是智能化落地的技术沉淀和数据基础。

1.行业内部驱动力

(1)我国教育发展内涵升级是教育智能化的原生动力

当前教育主要面临着3方面的难题:

第一个难题,缺乏教育公平。目前国内教育资源分布不均衡,我国东部沿海与中西部内陆地区经济发展的不均衡,也同样来带来教育资源分布的不均衡。同一地区,城乡教育水平也同样差距巨大。优质教育资源都集中在经济发达地区和城市,而欠发达地区和乡村这些最需要教育资源的地方,却非常缺资源。教育公平的社会诉求还没有实现。

第二个难题,教育质量有待提高。教育资源整体不足尤其是优质的教育资源。教学方法比较陈旧,节奏死板。评价方法不够科学,比较主观,对学生的的学情状况判断不够精准,自然也无法精准的做针对性的教学。

第三个问题,个性化教育急需发展。当前的教学难以满足学生个性化学习的需求。当前大部分学校的教育还都是大班制,大锅饭式的教育。但是每个学生的接受能力和对不同的知识点的掌握情况是不同。导致学生的薄弱点无法被很好的发现和解决,经常带着旧问题开始新的知识学习。学生对个性化的教育需求强烈。

而这些问题,就需要利用新的技术手段去破局。通过在线教育,利用互联网打破空间时间的限制,通过技术手段推进教育资源区域平衡。在相当大程度上,让每个人都有机会去享受到好的教育资源。通过大数据分析,AI技术可以实现精准的学情诊断,帮助老师实现精准化的教学,优秀教学案例的主动推送。个性化自适应教育,帮助用户了解自身知识掌握情况,科学的规划学习路径,推荐合适的学习资源,比如讲义,视频,习题,来针对性的提高学生的知识掌握能力。

(2)教育大数据价值变现是教育智能化的直接推手

目前教育领域内已经积累了大量的数据,包括各类教学资源,用户数据等等。这些数据就是行业里的金矿,但是目前的现状是虽然各个行业都在积极的积累数据,但是缺乏明确的应用出口,导致大部分数据的价值却并没有真正的发挥出来。反而昂贵的硬件成本和维护开销,让大数据中心成为了“成本中心”,难以变现。而教育场景下的,支撑教育智能化的各种上层应用,正是这些沉睡的大数据进行价值变现的出口。

(3)互联网+持续推进与发展激发了教育智能化发展

近十年来移动互联网的发展,以信息经济为主流的经济模式,推动移动互联网,云计算,大数据,物联网等与现代制造业结合,加速了我国整体工业化的完成,促进了电子商务,工业互联网,金融服务业等蓬勃发展。“互联网+“产生了深刻的经济革命,重塑了众多行业的生态。

随着AI技术的发展,互联网+模式的进一步演变,各个行业将逐渐变为AI+模式,智能化在各行各业也将带来深刻的变革。教育行业也一样,随着“互联网+教育”的持续深化,也顺其自然的催生了教育的智能化。

2.教育技术与数据基础

智能化在行业落地,并不是凭空建立,还要依托于行业本身的智能化基础,具体包括数据基础,信息化程度。教育行业经过多年的教育信息化发展,已经大体完成了信息化,并且具备了基本技术和数据基础。

1)教育信息化基础设施精良

优良的网络与硬件基础设施。目前在互联网基础设施方面已经逐渐完善,各种云服务,物联网设备,多屏互动,VR/AR设备都在教育场景应用落地。完善的各类信息化系统。目前智能教学系统(ITS),智能决策支持系统,智能计算机辅助教学(CAI)也已经在在教育行业中应用。丰富的教学样式与环境保障。MOOC大量MOOC平台的建设加速了细粒度、高质量、过程性教育数据的积累。翻转课堂,混合式学习逐渐普及。全流程覆盖的信息化。目前教育信息化已经实现了对教育的各个流程的覆盖,从课堂教学,到课外学习,从教育走班排课到教育管理。各个教育场景都已经有信息化的覆盖。

2)教育大数据积累基本完成

教育信息化已经基本做到了全流程的覆盖,在各类的教育信息系统中已经积累了大量的教育数据。教辅资料,教案,教学视频,课件,考纲等教学资料;电子教材,试卷,题库等各种学习资料。另外系统中存储了大量记录学生学习过程的行为数据。这些数据的积累构成了教育领域的整体数据资源体系。也是教育智能化的重要数据基础。

3.国内外教育智能化现状

1)国内教育智能化市场情况

目前国家层面已经发布了多项政策,加速推进教育智能化的发展,其中有《国家中长期教育改革和发展规划纲要(2010-2020)》、《国家教育事业发展“十三五”规划》等。今年疫情原因,直接让教育全都转到了线上,各个学习平台的用户都迎来一波暴涨,各种配合线上教育的工具也纷纷亮相。可以说疫情这只经济“黑天鹅”,却加速了互联网教育成为风口。互联网教育利用互联网,利用创新技术来解决行业用户的痛点,智能化教育是大势所趋。

(艾瑞咨询:2019AI+教育产业图谱)

教育智能化市场潜力巨大,也吸引了各大厂商从不同的产业环节进入这个市场。其中既包括传统互联网教育公司积极往智能化教育转型,比如好未来,新东方,沪江等。也包括专注AI教育不同细分市场的企业,比如英语流利说,乂学教育,批改网,学霸君等。更值得注意的是百度,阿里,腾讯,字节跳动,科大讯飞等企业利用自己在AI技术方面的积累,强势将业务版图延伸到教育领域。毫无疑问通过技术进一步变革教育行业,实现教育的智能化已经成为行业的发展方向。巨头们的加入,产业链的蓬勃,也意味着我国智能化教育将进入到一个发展的快车道。

国外的AI教育市场同样很火热,根据US Education Sector的Artificial Intelligence Market 报告,预计2017 - 2021年美国教育中的人工智能技术比例将增长47.5%。在美国AI教育行业的公司中,表现最突出是Knewton和Dreambox learning。

Knewton成立于2008年,总部位于纽约。Knewton是一家提供个性化教育的公司。覆盖的学生范围包括 K12、高等教育及职业发展教育等。Knewton利用适配学习技术,通过数据收集、推断及建议三部曲来提供个性化的教学。

Dreambox Learning成立于2006年,总部位于华盛顿。公司主要针对K8阶段,以游戏的方式来教授数字化的数学课程。该系统使用学生数据创建个性化学习计划,监控每个学生的优势和劣势、速度和解决问题的方法。根据学生的表现,系统在课程中进行调整。提供有关学生所犯错误类型的详细报告给老师,帮助老师进行差异化教学

三 教育领域学科知识图谱构建

教育与知识具有天然的联系, 因为教育从本质上来说就是知识的创生、传递、接收和加工过程。知识图谱作为认知智能的关键技术基础,在教育智能化走向“认知智能”这一更高级的阶段中,起着决定性作用。基于教育知识图谱可以实现精准教学,自适应性学习等场景下的智能化应用。教育知识图谱的构建是支撑智能化应用的第一步,接下来结合我们团队的实践和业界经验,来具体谈谈图谱建设的经验。

知识图谱的构建是典型的应用为导向的,在构建图谱之前先要理清楚要解决哪些问题,解决这些问题需要哪些知识,然后去设计知识图谱的本体,来覆盖这些知识。首先介绍一下教育知识图谱的一些常见应用场景和逻辑,基于这些应用来设计教育图谱的本体,然后进一步构建知识图谱。

(一)教育知识图谱的应用逻辑

教育知识图谱,以学科知识为核心,建立各个学科的知识点概念建立层级关系,知识点与知识点之间的关联关系,不同知识点之间的前后序关系,构成学科知识图谱。利用这个图谱,可以把知识点间的关系,通过可视化的形式展示给学生,一目了然,可以很天然的用来帮助学生构建知识体系,查阅知识要点,发现知识点之间的关联,帮助学生做总结沉淀,消灭知识盲区。

学科知识图谱构建之后,可以跟教学资源(教材,试题,讲义,教学视频,试卷等)构建关联,进而通过用户信息和学习记录,建立知识点与用户之间的关联。通过知识图谱,更加精准的刻画学生知识掌握情况,更加准确的刻画资源。从而实现对用户精准的学情研判,学习路径规划,学习资源个性化推荐。

也能帮助老师更好的了解学生学情,优化教学方法和调整教学策略。可以通过与教研资料关联,通过主动推荐教研来为老师教研备课提升效率和质量,以知识图谱问答为核心技术的辅助教学答疑系统可以有效的减轻简单重复问题给老师带来的负担,也能很大程度满足学生的答疑需求。基于这些应用场景和应用逻辑,下面具体进行图谱的设计和构建工作。

(二)以学科知识图谱为核心的教育知识资源建设

教育知识图谱有一些自身的特点。教育图谱中的点具有多样性,图谱中的点包括知识点,各类学习资源,以及知识点属性值,关系包括知识点间关系,知识点与学习资源间的关系,其中学习资源是可以动态变化。教育领域知识图谱,对质量要求非常高,准确率要达到近乎100%,因此审核校验阶段,需要业务人员的大量参与。这也是教育图谱落地的一个挑战。教育知识图谱,对多模态知识的需求强烈,对知识点,能以图片,视频,语音多种形式的表现,这也符合人们认识事物的习惯,除了文字描述同样需要一些具象化的感知。

1.学科知识图谱构建的整体流程

上图是学科知识图谱的构建的一个整体流程,具体包括以下几个关键点:

(1) 领域内纸质教育资源收集,并数字化,开放数据采集并进行数据预处理。

(2) 领域专家参与构建学科知识图谱的本体。

(3) 基于本体,采用众包标注,通过本体映射,从结构化/半结构化数据转换成三元组,从非结构化数据中利用多种算法模型抽取三元组。

(4) 将不同数据来源,不同方法抽取的知识三元组进行实体对齐,属性对齐等知识融合操作。

(5) 经过质量控制和多次优化迭代得到最终学科知识图谱,并根据实际需要选择适当的数据库进行存储。

(6) 通过知识关联建立学科知识图谱中知识点与各种教学资源的关联。

2.以学科知识图谱为核心的图谱本体层设计

以知识图谱为核心的教育知识资源建设,利用知识图谱建立起领域知识间的关联,知识点与不同版本的教材,教辅,讲义,视频,试题等各种教育资源之间建立关联,构成一个整体的网络。利用这些关联网络支撑上层应用。

教育图谱,本体层构建,主要是对教育领域内概念的梳理,关系,属性以及相关约束的定义,核心是schema的定义,需要深度的领域业务的理解。所以这部分当前还主要以领域专家梳理为主,以一定的技术手段作为辅助。领域专家梳理领域知识体系,可以按照自己熟悉和喜欢的方式去梳理,比如利用本体建模工具,xmind甚至excel都可以,参考课程标准和教材梳理出覆盖核心语义的概念和基本关系的知识体系。这一步的核心是表达出来当前领域的一个知识大体框架。然后图谱工程师,根据业务专家的梳理,按照知识图谱的建模原则进行调整。经过几次迭代,业务专家与图谱工程师配合合作,可以很好的构建出一套合适的schema。在构建schema时也可以通过分析实际应用场景的问题,来反推需要什么知识。

自上而下的专家梳理schema的方式也会有一些问题。第一,完全利用专家来梳理,会有很大的工作量,而且领域知识如果比较多的情况下,可能会有很多会被漏掉。第二,领域专家对知识体系的理解可能不一样,实际语料中的概念,关系的描述跟专家定义的也会有些区别。第三,专家定义的概念,关系,与实际语料中的描述经常会不太一致,导致在后续做抽取的时候,抽不准。基于这些问题,我们团队也在一些项目中通过先使用OpenIE的方法,主动从语料中挖掘出候选的概念和关系,自下而上会挖的比较全。把候选概念,关系给到业务专家,做参考,让业务专家去做“判断题”和“选择题”,通过这样的辅助大大的提高了建模效率。而且可以挖掘出同一概念,同一属性,关系在语料中的不同表述。

教育领域学科知识图谱中,知识之间的关系主要包括:上下位关系,主要是父子概念之间,概念与实体之间。概念图谱表达教育领域概念之间的关系。在教育领域概念性的内容会比较多,这些概念间关系就是整个知识的脉络。包含关系,知识点下几个具体的小考点,整体与部分的关系。先后序关系,可以用来做学习规划。在不同的学科还有一些特殊关系,比如互斥,因果等,这些是在实际做图谱资源建设的时候,需要领域专家与知识工程师一起去梳理细化的。

教育图谱中知识也有丰富的属性,比如共性的“考点”“难点”“易错点”“考纲要求”等共性属性。不同学科里有具体的细粒度属性,比如数学里面的“定义”“性质”“面积公式”“周长公式”等等。

3.知识抽取

当schema构建完成后,后续的三元组抽取,知识融合这些工作任务就明确了,可以灵活选用多种方法来进行抽取。值得注意的是,垂直领域的落地,不是几个炫酷的深度学习模型就能解决问题的。领域数据本身跟互联网,电商等通用领域比,要小的多,标注数据就更少了。这就导致用监督学习的模型,在领域数据中的适用性就变得差了很多。所以实际落地时会综合的适用多种方法,多种策略的组合来解决实际问题。首先在数据源上,优先选择结构化和半结构化这种优质的数据,以及好抽的关系,去快速构建初步版本。然后再逐步从非结构化数据中以及众包标注数据,来进一步补充知识。

知识抽取主要是领域实体识别和关系抽取(确切说是关系分类)。有pipeline的方式和JointModel两种方式,如果自己的标注数据充足的情况下可以考虑使用jointmodel的方式,标注数据量不够多的情况下,还是以pipeline的方式为主。目前pipeline的方式大家还是用的多一些。

(1)实体识别

常用的方法有基于规则的方法,基于无监督学习的方法,基于特征的有监督学习方法,以及深度学习的方法。教育(垂直)领域内的实体识别,与开放领域命名实体识别还是有挺大的不同,垂直领域(比如教育,医药,金融,工业的实体类型),不同于开放领域的任务只用识别人名,地名,机构名这些就好了,需要识别的是领域内专业名词。而且领域内标注数据的稀缺性,决定了在成本约束的情况下,有不少情况下都没法直接用在开放领域成熟的NER模型。但是领域内有个好处就是,一般会企业都会积累有该领域内的词库。可以利用这个词库,加上一些工程上的方法和策略综合去解决这个问题,例如运用规则,无监督学习等方法。

(2)关系抽取

领域落地时,优先使用结构化,半结构数据源。对于非结构化数据,主要利用规则的方法,学习的方法,以及现在比较流行的预训练模型,众包等方法综合解决。对于知识点间的前后序关系,可以利用频繁模式挖掘,流程挖掘等算法,从不同版本教材的目录安排,讲义章节安排,试卷知识点分布,用户行为日志等数据中,来挖掘知识点学习路径。

由于教育知识图谱对质量的要求非常高,所以在质量控制环节,对于知识执行度相对较低的知识,需要由教研人员进行人工的审核,来保证正确率。知识资源的构建过程是一个长期的发展过程,需要运营团队,算法工程团队配合,迭代完善。

四 知识图谱在智慧教育的应用

(一)应用框架概述

通过构建知识图谱把教育领域各个分散的系统里的数据,进行整合,并通过一系列技术“萃取”得到领域知识(课程知识,教学知识,学科知识,百科知识等)并以一种友好的方式,沉淀到知识库,建立起各种知识,教学资源之间的关联关系。基于教育知识知识图谱,以及自然语言,机器学习,数据挖掘,图挖掘,图推理技术,来提供语义搜索,精准推荐,用户画像,智能问答,行为预测,精准分析,决策支持等应用服务。这些构成了整个教育智脑。基于教育智脑,可以具体的应用于不同的教学场景中,赋能智慧教育。最终实现提升教学效率和教学质量,促进教育公平公正以及智能化个性化教育的目标。

(二)基于教育知识图谱的精准画像

基于教育图谱的精准画像,通过对用户的行为信息,与各种资源对象的联系,提取关键信息,来刻画用户,基于知识图谱的用户画像可以增强用户画像数据,对用户的刻画更加全面精准。

1.精准用户画像

用户画像技术大家应该已经比较熟悉,是为了更好的刻画用户,用来做用户理解,其本质就是“打标签”。用户画像精准与否决定了对用户的理解是否准确。实际应用中,用户画像主要有2个问题需要去解决,第一个方面是画像数据不完整,第二个方面是画像数据不正确。

(1)画像数据不完整

这个在领域数据中非常常见。第一个原因就是任何画像的来源数据都是有一定偏差的,一般描述的都是用户画像的某一方面,很难有一个非常完整的画像。第二个原因是领域中用户的行为数据量不够大。

(2)用户画像不正确

也就是说我们对用户画像的理解很多时候是错误的,这导致就会出现错误的推荐。导致不正确性的原因有很多,第一个就是机器还无法理解这些标签,也就无法基于画像做出精准的用户判断与推荐。理解标签,就需要有海量的背景知识去支撑它认知这些概念。

针对这些问题,可以利用知识图谱来解决。知识图谱本身上的节点是教育领域领域知识的抽象,覆盖足够多的实体,足够多的概念,可以作为用户画像的标签来源,精良的质量使得打上的标签更加的准确。这些标签间有具有联系,图谱中有丰富的语义关系,这样可以帮助机器去理解这些标签的意义。友好的结构利于人们去更好的理解,直观的发现标签间的关系。可以利用标签传播,跨领域推荐等算法去挖掘更多更精准的标签来描述用户,丰富用户标签,提升用户精准度。另外在做用户画像时,用户画像可以单独作为产品可视化的进行呈现,利用图谱中的关系,生成个性化的,动态变化的用户知识图谱。

2.精准学情分析

利用知识图谱可以进行更加精准的学情分析。传统教育专家(老师经验)的学习诊断,主要依靠经验对学习者的知识与能力状态进行评估,缺乏教育测量学思想的融入,具有较大的偶然性和主观性。基于知识图谱,大数据分析等方法对学习者客观的学习过程进行挖掘,从多种维度去做分析,数据可以挖掘的维度众多,不限于测试成绩,错题本,学习记录等行为轨迹中挖掘的知识掌握情况,薄弱知识这些显性的特征,同样可以挖掘一些深层次的学习速度,学习偏好,认知水平等隐形特征。让分析结果更加的个性化,客观化。

对于未能达成的学习目标,利用知识图谱可以做原因分析,发现薄弱点和关联依赖的知识点,能有效的查漏补缺。诊断过程具备更好的自适应性和个性化。

(三)提升教学质量与效率

知识图谱在辅助教学应用中,辅助老师去完成备课,教研,出题,试题分析的工作。系统可以以推荐的方式去为老师推荐同类相关的资料(教案,课程讲解规划,作业等)来提升老师的教学效率,基于图谱的搜索也可以更精准的返回所需内容。

1.智能备课

利用学科知识图谱把 学科知识点,与教材,讲义,习题等关联,根据老师的教学进度,教材版本,持续推送符合教学需求的备课资源,搭配搜索快速准确的得到老师所需的资源,提升备课效率和质量。除了备课,在智能组卷,考试分析中也可以利用学科知识图谱来作为背景知识辅助完成相关任务。极大的提升了教研的效率。

2.智慧课堂

通过对学情的精准分析,系统进行相关的巩固练习题推荐,针对性的制定教学策略,提升教学针对性,进行精准教学。

在课前,课中,课后综合运用数据挖掘和智能化能力。在课前利用数据挖掘技术得到的学生学情数据,制定教学策略,做到决策数据化。课中,利用制定的教学策略针对性的教学,讲解知识点,分组讨论教学。利用知识图谱对知识内在的关联进行可视化,帮助学生构建对知识的深层次认知。课后,推荐相关课后习题,根据学生学情状况,学习能力,个性化的针对性的练习题推荐,错题巩固。提升课堂教学的质量和针对性。将动态数据分析,动态学情诊断,贯穿教学全过程,实现因材施教,让教学决策数据化,智能化。

(四)使能自适应学习

1.资源推送与路径规划

基于知识图谱,数据分析技术,快速的检测定位学生的学习状况和薄弱点,基于对学生学情更加准确的判断,利用知识点之间关联关系,包括前后序关系,可以合理的为学生做针对性的推荐,推荐相关的内容以及学习策略,学习路径规划。将精准检测,内容推送,路径规划,整个流程作为动态闭环,稳步提升学生知识掌握程度。

精准检测检测学习水平,找到薄弱知识点。通过对学生过程化动态学习数据的自动分析,检测学生的学习水平,精确诊断学生的学习情况,并分析学生薄弱知识点。

内容推送,基于图谱的推荐,融合基于内容和协同过滤等多种推荐技术,让推荐更精准。给学生推荐更加针对性的内容。为学生提供推荐优质学习资源个性化学习资源,实现错题举一反三和使学生摆脱题海战术,大幅减少学生重复练习的时间和课业负担。基于知识图谱的推荐还可以从概念,前后序,属性等维度给予推荐结果解释。

学习路径规划,路径规划服务。基于知识点之间的关系,学生自身的学习偏好,学习能力等多个维度,为学生量身定制个性化学习方案,使学生从原来表层知识学习,逐步深入到深层学习。

2.精准的学习资源搜索

基于知识图谱可以对教学资源进行标签化,理解学习资源所涉及的知识点,关联考点,考题。深度理解用户输入的搜索内容,可以很好的实现语义搜索,精准的搜索到需要的资源。另外,利用知识图谱可以在用户进行相关实体搜索时,同时展示跟该实体相关的图谱子图。让用户能发现更多与该知识相关的知识,帮助用户进行知识的关联和发散学习。

(五)深度阅读

基于知识图谱的深度阅读,主要的目标是实现对知识间的关联,智能化,全面的认识知识。利用实体链接技术对电子出版物进行实体的识别与连接,可以通过知识卡片的形式展示当前知识信息。也可以关联到其他与之相关的知识,并进行相关知识的推荐,帮助用户把知识串联起来。这样可以极大的促进用户对知识的全面理解。深度阅读不仅可以运用于教育领域,也可以很好的应用与知识管理,以及出版行业。

深度阅读依赖的核心技术为实体链接技术,目前我们知识工场研发的实体理解服务使得机器可以理解文本中的实体,使得实体搜索、语义搜索成为可能,通用领域90%+准确率和召回率。

(六)答疑机器人

教育机器人已经成为教育领域的一个重要应用。利用以问答系统为核心的教育机器人,可以实现课程答疑,知识检索推荐,教学管理等一系列教学工作。既减轻了老师的负担和压力,又解决了学生的实际问题。一个优秀全面的教学机器人,是集成了任务型问答,Chatbot,知识型问答,搜索推荐系统等多个系统模块的综合体,同时具备多轮问答能力。知识图谱在问句query理解,知识引导的语言生成中起着重要作用,也是KBQA的核心。

语言理解模块是各类以问答为核心的智能产品的一个核心模块,主要是利用自然语言理解相关技术,让机器也能像人一样,去理解人类的语言,去理解用户的query。输入是经过ASR转换后的文本,输出是经过机器“理解”后的文本。要理解语言不是简单的从语法规则层面,而是真的懂背后的知识。领域知识图谱可以很好的帮助机器去理解用户的语言意图。

query预处理,对输入的query做进一步处理,对原始问题纠错,改写。实体识别,实体链接,将识别的实体,通过消歧等处理,正确的链接到知识图谱对应的实体上。利用预先定义好的角色,为关键词,或实体做的角色标注,识别句子的意图。对于多轮问答还需要进行多轮会话管理。

目前我们知识工场团队自主开发的以知识图谱为核心的通用领域问答产品“不倒翁问答”,集成了KBQA,FAQ,机器阅读理解等多项能力。除了单知识点问题外,在枚举类,判断类,比较类,常识类以及一些复杂问题上都达到了不错的效果。“不倒翁问答系统”有较好的迁移性,可以小代价迁移至垂直领域的应用中,目前已经在金融,司法,教育等多个垂直领域有具体的落地成果。其中在教育的知识问答和智能招生客服场景中,已有具体落地应用。

(六)提升学科知识服务水平

教育的目的还是为了给社会发展建设提供有用的人才。教育知识图谱同样可以服务于,教育的下游应用,对人才的选择招聘等。例如在就业市场,利用教育知识图谱可以很好的赋能智能招聘。利用学科知识图谱,可以应用与人岗匹配,岗位智能推荐等招聘场景中,提升企业招聘的效率和匹配度。提升招聘者的找工作效率和满意度。

五.以知识图谱为核心的教育智能化演进路径

知识图谱日益承担起助力行业智能化的使命。探索基于知识图谱的行业智能化演进路径因而十分关键。经过多年实践,这一路径日渐清晰,呈现出知识资源建设与知识应用迭代式发展模式。落地的基本原则:整体规划,应用引领,以用促建。知识资源建设与知识应用迭代式发展路径。

(一) 应用引领,以用促建

教育行业智能化落地,要遵循通用行业的落地方案,以应用为导向。教育应用场景众多,要整体规划,逐步落地,根据当前企业的业务发展需要和数据,技术基础,选择合适的应用场景,在具体的应用中建设图谱能力,并直接产生业务价值。不能盲目的为了图谱而图谱,没有具体业务出口做支撑,只是作为技术能力储备,除非是头部企业的AiLab不追求短期变现,否则很难在企业内部得到足够的支持。只有产生了具体的业务价值,才能有足够的动力,推动图谱为核心的智能化转型项目的长期,稳步发展。

(二) 迭代发展

在知识图谱在教育行业(垂直行业也一样)的智能化落地中,相比较于知识应用,知识的获取与知识资源的建设是更大的瓶颈。知识资源建设任重道远,很难一蹴而就,只能扎扎实实推进知识资源建设,积累知识库,没有捷径。采取由点及面的迭代式螺旋发展模式。

在每一轮迭代周期,把握好适度原则,优先选择预期效果较好的应用场景,合理把控好知识的边界与体量,建设以知识图谱为核心的知识资源,并开展相应的知识应用。再根据来自内外部用户的反馈,完善相应的应用与知识资源建设。当特定应用初现成效之后,再从有限的应用逐步拓展到更多的应用场景,建设更多的知识资源。整个过程持续迭代下去,直至完成全面的智能化。

六 总结

认知智能是高级人工智能的关键,认知智能的实现要依靠知识图谱。如今基于知识图谱的垂直行业智能化应用越来越多。在教育领域的很多应用场景都有不错的应用效果。但是目前认知智能及在教育领域应用总体还处于发展阶段,还有很多可以完善的地方。比如在图谱构建上,教育知识图谱对于多模态知识图谱的需求明显,教育领域的知识的复杂性,增加了对知识点的粒度的切分难度,另外知识点之间关系的丰富程度也是需要不断的优化。 总体来讲知识图谱在教育智能化中的应用,作用巨大,前景光明。相信随着技术的进一步成熟,国家政策的支持,资本的持续投入,商业公司的不断创新,教育智能化,会在接下来的几年,取得让人瞩目的落地成果。

发布于 2020-07-20 21:15