课程名称: CS276: Information Retrieval and Web Search(Spring quarter 2019

课程简介: 信息检索(Information Retrieval)是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。 IR是自然语言处理(NLP)领域中的第一个,并且仍然是最重要的问题之一。 网络搜索是将信息检索技术应用于世界上最大的文本语料库-网络-这是大多数人最频繁地与IR系统交互的区域。

在本课程中,我们将介绍构建基于文本的信息系统的基本和高级技术,包括以下主题:

  • 高效的文本索引
  • 布尔和向量空间检索模型
  • 评估和界面问题
  • Web的IR技术,包括爬网,基于链接的算法和元数据使用
  • 文档聚类和分类
  • 传统和基于机器学习的排名方法

讲师介绍: Christopher Manning,SAIL 新任负责人,Christopher Manning于1989年在澳大利亚国立大学取得三个学士学位(数学、计算机和语言学),并于 1994 年获得斯坦福大学语言学博士学位。 他曾先后在卡内基梅隆大学、悉尼大学等任教,1999 年回到母校斯坦福,就职于计算机科学和语言学系,是斯坦福自然语言处理组(Stanford NLP Group)的创始成员及负责人。重返斯坦福之后,他一待就是 19 年。 Manning 的研究目标是以智能的方式实现人类语言的处理、理解及生成,研究领域包括树形 RNN 、情感分析、基于神经网络的依存句法分析、神经机器翻译和深度语言理解等,是一位 NLP 领域的深度学习开拓者。他是国际计算机学会 (ACM)、国际人工智协会(AAAI)、国际计算语言学会(ACL)等国际权威学术组织的 Fellow,曾获 ACL、EMNLP、COLING、CHI 等国际顶会最佳论文奖,著有《统计自然语言处理基础》、《信息检索导论》等自然语言处理著名教材。

Pandu Nayak,谷歌工程师,负责信息检索方面的研究。 在加入Google之前,我曾是Stratify,Inc.的首席架构师和首席技术官。在那里,帮助开发了成功的Stratify Legal Discovery服务。

成为VIP会员查看完整内容
8+
0+

相关内容

小利兰·斯坦福大学(英语:Leland Stanford Junior University),常直接称为斯坦福大学Stanford University),为一所坐落于美国加利福尼亚州斯坦福的私立研究型大学,临近硅谷,是美洲大学协会的14个创始会员之一,因其学术声誉和创业氛围而获评为世界上最知名的高等学府之一。[9][10][11][12]

斯坦福大学于1891年由时任加州参议员州长的铁路大亨利兰·斯坦福和他的妻子简·莱思罗普·斯坦福英语Jane Stanford创办。这是为了纪念他们因伤寒而于16岁生日前夕去世的儿子(小利兰·斯坦福英语Leland Stanford, Jr.)。斯坦福大学为男女及宗教自由的学校,在1930年代前所有学费全免。[13]可是,1893年利兰·斯坦福的逝世及1906年对校园造成重大损毁的旧金山大地震,为该校带来严重的财政困难后才开始收费。[14]二次世界大战后,时任学校教务长的弗雷德里克·特曼全力支持校友与教职员的企业精神,希望能建立一个自给自足的本地工业,这也是现今硅谷的源流。

学校的校园位于硅谷的西北方,邻近帕罗奥图[15]自上世纪七十年代,斯坦福成为了美国SLAC国家加速器实验室的所在地,及其中一个高等研究计划署网络互联网雏形)的起源地。[16]校方的各个学术部门被归入七所学术学院内,而包括生物保育区及加速实验室在内的其他资产则设于主校区之外。[6] 此校同时为最富有的教育机构之一,并为第一所在一年内获得超过十亿美元捐款升幅的大学。[17]

斯坦福为一所拥有高住宿率及高选择性的大学,当中的研究生课程较本科的多元化。斯坦福学生透过36支代表队参与不同的体育竞赛,其为两所太平洋十二校联盟的私立大学之一。截止2018年,斯坦福大学的学生和校友在历届奥运会上赢得了包括139枚金牌在内的270枚奥运奖牌。[18]有关校队曾夺得过104次大学体育协会赛事的冠军,成绩于众多大学中位列第二。自1994-95年起,其亦一直为全国大学体育竞技董事杯的年度得主。[19]

截止2019年10月,斯坦福大学的校友、教授及研究人员中,共产生了83名诺贝尔奖得主8位菲尔兹奖得主以及27位图灵奖得主[注 2]斯坦福培养了不少著名人士,其校友涵盖30名富豪企业家及17名太空员,亦为培养最多美国国会成员的院校之一。[20][21]斯坦福校友在世界各地创办了众多著名的公司机构,如:谷歌雅虎惠普思科系统耐克昇阳电脑台积电英伟达艺电等等,这些企业的资金合计相等于全球第十大经济体系(截止2011年)。[22]

报告主题: 信息检索

报告摘要: 信息检索是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户特定的需要将相关信息准确的查找出来的过程。又称信息的存储于检索。

邀请嘉宾: 任昭春,博士,山东大学教授,博士生导师。2016年10月在荷兰阿姆斯特丹大学取得博士学位;2016年至2017年在伦敦大学学院工作,2017年至2019年在京东数据科学实验室担任算法科学家。任昭春主要从事信息检索和自然语言处理方面的研究,特别关注于社交媒体内容分析,搜索多样性,问答和对话系统,以及可解释性推荐系统等研究问题,目前已在计算机领域各个国际顶级会议和期刊上共发表60余篇论文,获得信息检索领域国际顶级会议WSDM2018最佳学生论文奖和CIKM2017最佳长论文提名奖;应邀担任信息检索领域和自然语言处理领域多项顶级会议程序委员会委员和顶级期刊审稿人。同时任昭春在信息检索领域一直担任多项会议和期刊的组织服务工作。

成为VIP会员查看完整内容
5+
0+

报告题目: Discreteness in Neural Natural Language Processin

报告摘要: 本教程对神经NLP离散化过程提供了全面的介绍。首先,我们将简要介绍基于NLP的深度学习的背景,指出自然语言普遍存在的离散性及其在神经信息处理中的挑战。特别地,我们将集中在这样的离散性如何在一个神经网络的输入空间、潜在空间和输出空间中发挥作用。在每个部分中,我们将提供示例,讨论机器学习技术,并演示NLP应用程序。

*邀请嘉宾: Lili Mou博士是阿尔伯塔大学计算机科学系的助理教授。Lili分别于2012年和2017年在北京大学EECS学院获得了学士和博士学位。之后,他在滑铁卢大学(University of Waterloo)担任博士后,并在Adeptmind(加拿大多伦多的一家初创公司)担任研究科学家。他的研究兴趣包括应用于自然语言处理以及编程语言处理的深度学习。他在顶级会议和期刊上都有出版物,包括AAAI,ACL,CIKM,COLING,EMNLP,ICASSP,ICML,IJCAI,INTERSPEECH,NAACL-HLT和TACL(按字母顺序)。

周浩是Bytedance AI实验室的研究员 ,从事自然语言处理。2017年获得南京大学计算机科学博士学位。他的研究兴趣是机器学习及其在自然语言处理中的应用。目前,他专注于自然语言生成的深度生成模型。

李磊博士是今日头条的研究科学家和今日头条实验室的主任。Lei拥有上海交通大学计算机科学与工程学士学位(ACM类)和博士学位。分别从卡内基梅隆大学获得计算机科学博士学位。他的有关挖掘共同演化时间序列的快速算法的论文工作被ACM KDD授予最佳论文奖(排名提高)。在加入头条之前,他曾在百度的硅谷深度学习研究所担任首席研究科学家(“少帅学者”)。在此之前,他曾在Microsoft Research(亚洲和Redmond),Google(Mountain View)和IBM(TJ Watson Reserch Center)工作过。在加入百度之前,他曾在加州大学伯克利分校的EECS部门担任博士后研究员。他的研究兴趣在于深度学习,统计推断,自然语言理解和时间序列分析。他曾在ICML 2014,ECML / PKDD 2014/2015,SDM 2013/2014,IJCAI 2011/2013/2016,KDD 2015 / 2016、2017 KDD Cup联合主席的程序委员会中任职,并在2014年暑期学校担任讲师促进机器学习的概率编程研究。他发表了30多篇技术论文,并拥有3项美国专利。

成为VIP会员查看完整内容
6+
0+

报告主题:Recent Breakthroughs in Natural Language Processing

报告摘要:自然语言处理是计算机科学、语言学和机器学习的交叉点,它关注计算机与人类之间使用自然语言中的沟通交流。总之,NLP致力于让计算机能够理解和生成人类语言。NLP技术应用于多个领域,比如天猫精灵和Siri这样的语音助手,还有机器翻译和文本过滤等。机器学习是受NLP影响最深远的领域之一,尤为突出的是深度学习技术。该领域分为以下三个部分:语音识别、自然语言理解、自然语言生成。本次报告结合NLP的最新突破,分别剖析不同领域的研究进展,并对未来的研究方向作出简单概述。

邀请嘉宾:Christopher Manning,SAIL 新任负责人,于1989年在澳大利亚国立大学取得三个学士学位(数学、计算机和语言学),并于 1994 年获得斯坦福大学语言学博士学位。 他曾先后在卡内基梅隆大学、悉尼大学等任教,1999 年回到母校斯坦福,就职于计算机科学和语言学系,是斯坦福自然语言处理组(Stanford NLP Group)的创始成员及负责人。重返斯坦福之后,他一待就是 19 年。

Manning 的研究目标是以智能的方式实现人类语言的处理、理解及生成,研究领域包括树形 RNN 、情感分析、基于神经网络的依存句法分析、神经机器翻译和深度语言理解等,是一位 NLP 领域的深度学习开拓者。他是国际计算机学会 (ACM)、国际人工智协会(AAAI)、国际计算语言学会(ACL)等国际权威学术组织的 Fellow,曾获 ACL、EMNLP、COLING、CHI 等国际顶会最佳论文奖,著有《统计自然语言处理基础》、《信息检索导论》等自然语言处理著名教材。

成为VIP会员查看完整内容
2019-10-31-02-01-Christopher-Manning.pdf
4+
0+

报告主题:开放语义解析

报告摘要:语义解析(Semantic Parsing)是将自然语言句子转换为机器可识别的、可计算的语义表示的任务。语义解析是自然语言处理的核心任务之一,在智能问答、语音助手、智能机器人、代码生成等任务上具有广泛的应用。本报告将详细介绍语义解析这项任务,首先介绍语义解析任务、数据集和工具,然后依次介绍基于文法的语义解析方法(CCG,DCS等)、基于语义图构建的语义解析方法和新兴的神经语义解析方法(Seq2Seq, Seq2Act, coarse-to-fine等),最后对语义解析的前沿方向和重要挑战进行展望,包括上下文有关的语义解析(可用于对话),与周边环境有交互的语义解析(如用于机器人执行指令)。

报告嘉宾:韩先培,博士,中国科学院软件研究所中文信息处理实验室/计算机科学国家重点实验室研究员。主要研究方向为信息抽取、知识图谱、语义解析以及智能问答系统。在ACL、SIGIR、AAAI、EMNLP等重要国际会议发表论文四十余篇。韩先培是中国中文信息学会理事,语言与知识计算专业委员会副主任,中国科学院青促会会员,入选中国科协青年人才托举计划,获得中国中文信息学会汉王青年创新奖。 陈波,博士,中国科学院软件研究所中文信息处理实验室助理研究员,2018年获得中国科学院大学博士学位,并获得优秀毕业生。主要研究方向为语义解析(Semantic Parsing)和自然语言理解。在ACL、COLING、NAACL等自然语言处理国际顶级会议发表学术论文多篇。参与多项国家自然科学基金重点课题以及企业合作科研项目的研发。

成为VIP会员查看完整内容
CIPS_SSATT_2019_开放域语义解析_韩先培_陈波.pdf
3+
0+
Top