如何构建行业知识图谱 (以电影行业为例)

10 月 9 日 NLPJob

着人工智能走到台前,人们越来越认识到,场景才是盘活存量数据、吸附和创造增量数据,最终产生更加强大智能的核心。数据驱动的人工智能正在朝着场景驱动的人工智能发展。果要用数字化给一个行业赋能,那么机器首先要理解这个行业,而理解这个行业的最直接的表现就是能够玩转这个行业的知识图谱可以说,知识图谱,是场景的骨架和灵魂,是把更多行业知识、领域知识转化为数字化生产力的知识基础设施。

作为国内最早发布“知识图谱”产品的平台之一,百度很早已经将知识图谱广泛应用到众多产品线中。 自2014年百度知识图谱上线开始,知识图谱服务规模三年间增长了大约160倍。 同样,得益于知识图谱技术的应用,搜狗的2016年搜索流量也急速攀升,其中移动搜索流量增长了70%。

以社交为主战场的腾讯利用其数据优势构建了自己的社交知识图谱,基于微信、QQ、公众号、视频、音乐等数据,腾讯构建出的知识图谱可以服务于众多产品,助力语音搜索、智能问答等新兴技术的快速发展。以电商为主战场的阿里也基于自身的数据库建立起了知识图谱,基于此建立的个性化推荐系统为阿里生态的营收立下了汗马功劳。

另一边,国内的知识图谱创业公司近年来开始涌现。一些大数据公司开始在自己的名字后面加上“知识图谱”四个字,以更好地承接业务。 为避免与BAT直接交锋,创业公司们另辟蹊径,切入智能客服、金融、法律、公安、航空、医疗等 “知识密集型”领域,在知识图谱这片蓝海中分别找到了自己的定位和市场。

“知识图谱”搜索指数逐年提升

随着知识图谱技术在搜索、聊天机器人、大数据风控、智能医疗、证券投资、推荐系统等领域的应用以及企业的入场,相关人才需求逐年增加,供不应求在各大主流招聘网站上,可以看到知识图谱工程师的薪资普遍高于其他AI领域。越来越多技术人员开始转向知识图谱领域的研发,但是由于知识图谱知识点广,可参考的资料不多,同时线上线下有价值的知识图谱实战类课程极少,给知识图谱的入门和能力提升带来极大困难。

图片来源于招聘网站Boss直聘

基于此,深蓝学院联合国内知识图谱领域的知名学者,推出知识图谱线下集训课程集训为时4天,致力于通过8个半天和4个晚自习的高强度课程学习&实践,即学即练,帮助学员系统掌握知识图谱各个生命周期的主流核心技术,学会如何独立实现一个基于知识图谱的问答系统,并最终构建行业知识图谱。(本次集训以构建电影行业知识图谱为教学实战案例)

第一期和第二期集训地点分别设在北京、上海,目前均已经顺利收官!报名的学员里有来自华为、航旅纵横等企业人员以及来自中科院、国防科大、中国人民大学、北航、中南大学、浙江工业大学、山东大学、南京大学等科研院所的学生。

图为第一期知识图谱线下集训现场,讲师正在授课、答疑

图为第二期知识图谱线下集训现场,讲师正在授课、

图为第一期知识图谱线下集训师生合影

图为第二期知识图谱线下集训师生合影

应同学们的要求,现在开设第三期集训,地点定于北京,限招40人本次集训提供所有代码、说明文档及操作视频(如下所示),为了确保学员的实战效果,还另外安排一个月的线上答疑和实战项目指导

集训课程大纲


实践项目介绍








本次集训适合谁参加

1. 研究方向与知识图谱相关的硕博研究生

2. 想成为或者转型做知识图谱工程师的学员

3. 计划拓展知识图谱相关业务、想提升团队专业素质的企业人员


完成本次集训你将获得哪些技能

讲师介绍

曾博 ,高校讲师,中科院自动化所模式识别国家重点实验室博士,主要研究方向为信息抽取、知识图谱、自然语言处理,迄今在包括ACL、EMNLP、COLING、IJCAI等国际顶级会议上发表多篇学术论文,曾获得COLING、CCL最佳论文奖。 主持多项国家自然科学基金青年基金、湖南省自然科学基金等项目,参与了国家自然科学基金、国家重点基础研究发展计划(973计划)及华为等多个科研项目,具有丰富的知识图谱落地实践经验。

第三期集训的时间、地点、费用等其他信息

间: 2019年10 月24日(周四)- 27日(周日)

地点:北京 (具体地点将在答疑群里同步给大家)

剩余名额16

费用:目前限时优惠价4499。学费将主要用于Cover场地+人力成本+学习材料等相关费用。

需要具备的基础:线性代数和概率论基本概念、Python 3基础知识、最好可以了解深度学习基础知识(卷积神经网络、循环神经网络等)

完成集训将获得:全套纸质版讲义、实践项目所有代码、80篇知识图谱精选论文、《知识图谱》《知识图谱:方法、实践与应用》(两本专业书籍可任选一本)

如何申请参加本次集训


点击“阅读原文”,查看集训详细安排
登录查看更多
12+

相关内容

近年来,以机器学习、知识图谱为代表的人工智能技术逐渐变得普及。从车牌识别、人脸识别、语音识别、智能问答、推荐系统到自动驾驶,人们在日常生活中都可能有意无意地使用到了人工智能技术。这些技术的背后都离不开人工智能领域研究者们的长期努力。特别是最近这几年,得益于数据的增多、计算能力的增强、学习算法的成熟以及应用场景的丰富,越来越多的人开始关注这一个“崭新”的研究领域:深度学习。深度学习以神经网络为主要模型,一开始用来解决机器学习中的表示学习问题。但是由于其强大的能力,深度学习越来越多地用来解决一些通用人工智能问题,比如推理、决策等。目前,深度学习技术在学术界和工业界取得了广泛的成功,受到高度重视,并掀起新一轮的人工智能热潮。

本课程主要介绍神经网络与深度学习中的基础知识、主要模型(前馈网络、卷积网络、循环网络等)以及在计算机视觉、自然语言处理等领域的应用。

nndl-book.pdf
5+
0+
Top