NLP高阶攻略,新手莫入!

2020 年 8 月 25 日 AINLP

行业上90%以上的NLP工程师是“不合格的”。


一直坚信AI人才的最大壁垒是创造力,能够持续为变化的业务带来更多的价值。但创造的前提一定是对一个领域的深度理解和广度认知,以及不断对一个事物的追问,比如不断问自己为什么:

  • 为什么在这个问题上使用Adam,而不是GD或者Adagrad?  

  • 对于特定的业务场景,我应该如何把领域知识考虑进去, 用先验,还是用限制条件?

  •  对于拼车场景,设计了一套优化目标,但好像是离散优化问题,应该如何解决?

  •  对于二分类,我应该选择交叉熵还是Hinge Loss?

  • BERT模型太大了,而且效果发现不那么好比如next sentence prediction, 能不能改一改? 

  • 为什么CRF要不HMM在不少NLP问题上效果更好? 

  • 文本生成效果不太好,如何改造Beam Search让效果更好呢?

  • 训练主题模型效率太慢了,如果改造吉布斯采样在分布式环境下运行呢? 

  • 数据样本里的标签中有一些依赖关系,能不能把这些信息也加入到目标函数里呢?


另外,有必要保持对前沿技术的敏感性,但事实上,很多人还是由于各种原因很难做到这一点。基于上述的目的,贪心学院一直坚持跑在技术的最前线,帮助大家不断地成长。


为什么选择贪心学院的《NLP高阶训练营》?


首先,全网不可能找得到另外一门系统性的训练营具备如此的深度和广度,这里包括国外的课程,所以从内容的角度来讲是非常稀缺的内容。


其次,即便网络上的资源非常多,学习是需要成本的,而且越有深度的内容越难找到好的学习资源。如果一门课程帮助你清晰地梳理知识体系,而且把有深度的知识点脉络讲清楚,这就是节省最大的成本。


另外,作为一家专注在AI领域的教育科技公司,教研团队的实力在同行业可以算是非常顶尖的,这里不乏顶会的最佳论文作者、ALBERT的作者等。


最后,我们这一期的NLP高阶训练营(第八期)在原有的基础上做了大量的升级,融合了更多前沿的内容,而且在部分内容上加深了难度。

《NLP高阶训练营》

👇👇👇

添加课程顾问小姐姐,备注【NLP】

领取课程优惠名额


01课程大纲

《NLP高阶训练营》

👇👇👇

添加课程顾问小姐姐,备注【NLP】

领取课程优惠名额


02部分项目作业


课程设计 紧密围绕学术界最新进展以及工业界的需求, 涵盖了所有核心知识点,并且结合了 大量实战项目, 培养学员的动手能力,解决问题能力。

问答系统


从零开始搭建一个完整的问答系统。 给定一个语料库(问题和答案对),对于用户的输入需要返回最适合的答案。 涉及到的模块:
1. 对于用户的输入需要做拼写纠错,这部分会用到语言模型
2. 之后对输入做文本的预处理,过滤等操作。
3. 把文本转换成向量形式,这里需要用到tf-idf, word2vec等相关的技术。
4. 针对于语料库,为了提升效率需要创建倒排表。
5. 基于相似度的计算来获得最优的答案。

情感分析系统


基于给定数据,来搭建一个完整的情感分析系统。 项目涉及到的模块:
1. 数据的预处理
2. 特征工程,这部分是本项目的核心。
3. 监督学习模型的选择与调参。 调参的过程需要尝试不同的优化策略。

知识图谱系统


利用非结构化数据来搭建知识图谱。 项目涉及到的模块:
1. 从非结构化数据中抽取实体,以及词典库的构建
2. 关系的抽取(指定的关系)
3. 实体统一以及实体消歧。
4. 知识图谱的构建以及查询

对话系统中的NLU


基于给定的对话数据来构建NLU识别部分,并结果用于聊天机器人中。  项目涉及到的模块:
1. 文本特征的提取
2. 搭建CRF模型来识别关键词
3. 搭建LSTM-CRF模型来识别关键词。

机器翻译系统


基于给定数据,来搭建一个完整的情感分析系统。 项目涉及到的模块:
1. 数据的预处理
2. 特征工程,这部分是本项目的核心。
3. 监督学习模型的选择与调参。 调参的过程需要尝试不同的优化策略。

任务导向型聊天机器人


搭建一个完整的聊天机器人,用来服务搜索餐厅。 项目涉及到的模块:
1. 文本预处理
2. 意图识别和关键信息抽取
3. 对于每一个意图设计对话管理状态机
4. 设计上下文处理的方法
5. 对话生成模块
6. 处理一些常见的boundary case。


03直播授课,现场推导演示


区别于劣质的PPT讲解,导师全程现场推导, 让你在学习中有清晰的思路,深刻的理解算法模型背后推导的每个细节。更重要的是可以清晰地看到各种模型之间的关系!帮助你打通六脉!

▲源自:CRF与Log-Linear模型讲解
▲源自:CRF与Log-Linear模型讲解
▲源自:Convex Optimization 讲解
▲源自:Convergence Analysis 讲解
不管你在学习过程中遇到多少阻碍,你都可以通过以下4种方式解决:
1、直接在线问导师;
2、记录到共享文档中,每日固定时间的直播答疑;
3、学习社群中全职助教,随时提问答疑
4、共同的问题在Review Session里面做讲解


注:每次答疑,班主任都会进行记录,以便学员实时查阅。

《NLP高阶训练营》

👇👇👇

添加课程顾问小姐姐,备注【NLP】

领取课程优惠名额


04每周课程安排


采用直播的授课方式,一周4-5次的直播教学, 包括2次的main lectures, 1-2次的discussion session (讲解某一个实战、必备基础、案例或者技术上的延伸), 1次的paper reading session (每周会assign一篇必备论文,并且直播解读)。教学模式上也参考了美国顶级院校的教学体系。以下为其中一周的课程安排,供参考。 




05你的必备挑战


1.编写一些技术类文章


通过在知乎上发表相关技术文章进行自我成果检验,同时也是一种思想碰撞的方式,导师会对发表的每一篇文章写一个详细的评语。万一不小心成为一个大V了呢?虽然写文章的过程万分痛苦,学习群里半夜哀嚎遍野,但看一看抓着头发写出来的文章结果还是非常喜人的!看着自己收获的点赞数,大家都默默地感谢起导师们的无情!


这种满满的成就感,让大家一篇接一篇写了下去!
个个都立刻变身成了知乎大牛~


2.Project项目 & 日常作业


除了文章,算法工程师的立命根本--项目代码, 导师更是不会放过的。每次在Gitlab上布置的作业,导师们都会带领助教团队会予以详细的批改和反馈。并逼着你不断的优化!



06 课程研发团队
贪心学院联合来至Google、亚马逊、微软等AI企业11位AI科学家 对课程内容进行不断的打磨细化,课程基础部分涵盖了该AI技术邻域从业者必备的所有核心知识点,同时在课程深度上加入了 最新的学术研究及工业界的最新进展相关的教学, 确保学员学到国内外企业中热门AI知识技能。
▲部分课程研发导师简介

这两天群里更是捷报连连。 我们前三期项目的已经有多名学员被一线AI企业录取,还有通过二面、三面等待着offer。 相信未来几周我们将会受到更多的好消息!
随便截了几个学员反馈。

  



我确定了我们的魔鬼训练营没有误人子弟,我们的课程真的帮助到大家实质的技能提升或帮助大家拿到offer。


这次我们迎来了第八期NLP的招生,千万不要觉得这是一个对标其他线上课程的普通的训练营。由于内容的专业性以及深度,在过去吸引了大量的全球顶级名府的学员, 这里不乏来自斯坦福、UCSD、USC、哥大、HKUST、爱丁堡等世界名府的学生; 在这里,你不仅可以享受到通往顶尖人才的快乐、也可以结识志同道合的AI从业者以及未来的科学家。 


07报名须知

1、本课程为收费教学。
2、 本期仅招收剩余 名额23人。
3、品质保障!正式 开课后7天内,无条件全额退款。
4、学习本课程需要具备一定的AI基础。

《NLP高阶训练营》

👇👇👇

添加课程顾问小姐姐,备注【NLP】

领取课程优惠名额

登录查看更多
0

相关内容

NLP:自然语言处理
一图搞定ML!2020版机器学习技术路线图,35页ppt
专知会员服务
92+阅读 · 2020年7月28日
商业数据分析,39页ppt
专知会员服务
157+阅读 · 2020年6月2日
【哈佛《CS50 Python人工智能入门》课程 (2020)】
专知会员服务
109+阅读 · 2020年4月12日
简明扼要!Python教程手册,206页pdf
专知会员服务
46+阅读 · 2020年3月24日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
347+阅读 · 2020年2月15日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
【机器学习课程】机器学习中的常识性问题
专知会员服务
72+阅读 · 2019年12月2日
3个可以写进简历的京东NLP项目实战
专知
11+阅读 · 2020年6月4日
我的推荐系统入门经验~
大数据技术
39+阅读 · 2019年9月19日
准备了2个月,终于拿到了推荐算法岗的offer
算法与数据结构
7+阅读 · 2019年5月31日
体系化入门AI产品经理,应该如何学习
人人都是产品经理
7+阅读 · 2019年5月4日
学术派整理,一份从基础到实战的 NLP 学习清单
人工智能头条
7+阅读 · 2019年2月13日
普通程序员转型深度学习指南
大数据技术
6+阅读 · 2017年12月27日
Arxiv
8+阅读 · 2020年8月30日
Arxiv
4+阅读 · 2019年9月5日
Logic Rules Powered Knowledge Graph Embedding
Arxiv
7+阅读 · 2019年3月9日
Embedding Logical Queries on Knowledge Graphs
Arxiv
3+阅读 · 2019年2月19日
Arxiv
22+阅读 · 2018年8月30日
VIP会员
相关VIP内容
一图搞定ML!2020版机器学习技术路线图,35页ppt
专知会员服务
92+阅读 · 2020年7月28日
商业数据分析,39页ppt
专知会员服务
157+阅读 · 2020年6月2日
【哈佛《CS50 Python人工智能入门》课程 (2020)】
专知会员服务
109+阅读 · 2020年4月12日
简明扼要!Python教程手册,206页pdf
专知会员服务
46+阅读 · 2020年3月24日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
347+阅读 · 2020年2月15日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
【机器学习课程】机器学习中的常识性问题
专知会员服务
72+阅读 · 2019年12月2日
相关资讯
3个可以写进简历的京东NLP项目实战
专知
11+阅读 · 2020年6月4日
我的推荐系统入门经验~
大数据技术
39+阅读 · 2019年9月19日
准备了2个月,终于拿到了推荐算法岗的offer
算法与数据结构
7+阅读 · 2019年5月31日
体系化入门AI产品经理,应该如何学习
人人都是产品经理
7+阅读 · 2019年5月4日
学术派整理,一份从基础到实战的 NLP 学习清单
人工智能头条
7+阅读 · 2019年2月13日
普通程序员转型深度学习指南
大数据技术
6+阅读 · 2017年12月27日
Top
微信扫码咨询专知VIP会员