课程题目

From Languages to Information

课程内容

《从语言到信息》是一门(半)翻转的课程,有很多在线材料。大部分讲座都有录像,你可以在家里看。每周的测验和编程作业将自动上传和评分EdX提供讲座、测验和家庭作业。网络世界以语言和社交网络的形式存在着大量的非结构化信息。学习如何理解它,以及如何通过语言与人类互动,从回答问题到给出建议。从人类语言文本、语音、网页、社交网络中提取意义、信息和结构。介绍方法(字符串算法、编辑距离、语言建模、机器学习分类器、神经嵌入、倒排索引、协作过滤、PageRank)、应用(聊天机器人、情感分析、信息检索、问答、文本分类、社交网络、推荐系统),以及两者的伦理问题。

课程嘉宾

Dan Jurafsky ,人文学科教授,斯坦福大学计算机科学教授兼语言学主席,研究自然语言处理及其在认知和社会科学中的应用。

成为VIP会员查看完整内容
0
11

相关内容

Dan Jurafsky ,人文学科教授,斯坦福大学计算机科学教授兼语言学主席,研究自然语言处理及其在认知和社会科学中的应用。

神经网络为建模语言提供了强大的新工具,并已被用于改善一些任务的最新技术,并解决过去不容易解决的新问题。这门课(在卡内基梅隆大学语言技术学院)将从神经网络的简要概述开始,然后用大部分时间展示如何将神经网络应用于自然语言问题。每个部分将介绍一个特定的问题或自然语言的现象,描述为什么很难建模,并演示几个模型,旨在解决这个问题。在此过程中,本课程将涵盖在创建神经网络模型中有用的不同技术,包括处理不同大小和结构的句子、高效处理大数据、半监督和非监督学习、结构化预测和多语言建模。

成为VIP会员查看完整内容
0
41

课程简介: 本课程将向学生介绍NLP的基础知识,涵盖处理自然语言的标准框架以及解决各种NLP问题的算法和技术,包括最新的深度学习方法。 涵盖的主题包括语言建模,表示学习,文本分类,序列标记,语法解析,机器翻译,问题解答等。

课程安排:

  • 概述与简介
  • 语言模型
  • 文本分类
  • 线性模型
  • 词嵌入
  • 神经网络基础
  • 序列模型
  • EM模型
  • RNN神经语言模型
  • 解析介绍
  • 机器翻译
  • 神经机器翻译
  • 文本词嵌入
  • 问答系统
  • 对话系统
  • 嘉宾讲座

嘉宾介绍:

陈丹琦,普林斯顿大学计算机科学的助理教授,在此之前,是西雅图Facebook AI Research(FAIR)的访问科学家。 斯坦福大学计算机科学系获得博士学位,并在斯坦福NLP集团工作。研究方向:自然语言处理,文本理解、知识解释。

Karthik Narasimhan,普林斯顿大学计算机科学系助理教授,研究跨越自然语言处理和强化学习。

成为VIP会员查看完整内容
0
42

课程名称: CS276: Information Retrieval and Web Search(Spring quarter 2019

课程简介: 信息检索(Information Retrieval)是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。 IR是自然语言处理(NLP)领域中的第一个,并且仍然是最重要的问题之一。 网络搜索是将信息检索技术应用于世界上最大的文本语料库-网络-这是大多数人最频繁地与IR系统交互的区域。

在本课程中,我们将介绍构建基于文本的信息系统的基本和高级技术,包括以下主题:

  • 高效的文本索引
  • 布尔和向量空间检索模型
  • 评估和界面问题
  • Web的IR技术,包括爬网,基于链接的算法和元数据使用
  • 文档聚类和分类
  • 传统和基于机器学习的排名方法

讲师介绍: Christopher Manning,SAIL 新任负责人,Christopher Manning于1989年在澳大利亚国立大学取得三个学士学位(数学、计算机和语言学),并于 1994 年获得斯坦福大学语言学博士学位。 他曾先后在卡内基梅隆大学、悉尼大学等任教,1999 年回到母校斯坦福,就职于计算机科学和语言学系,是斯坦福自然语言处理组(Stanford NLP Group)的创始成员及负责人。重返斯坦福之后,他一待就是 19 年。 Manning 的研究目标是以智能的方式实现人类语言的处理、理解及生成,研究领域包括树形 RNN 、情感分析、基于神经网络的依存句法分析、神经机器翻译和深度语言理解等,是一位 NLP 领域的深度学习开拓者。他是国际计算机学会 (ACM)、国际人工智协会(AAAI)、国际计算语言学会(ACL)等国际权威学术组织的 Fellow,曾获 ACL、EMNLP、COLING、CHI 等国际顶会最佳论文奖,著有《统计自然语言处理基础》、《信息检索导论》等自然语言处理著名教材。

Pandu Nayak,谷歌工程师,负责信息检索方面的研究。 在加入Google之前,我曾是Stratify,Inc.的首席架构师和首席技术官。在那里,帮助开发了成功的Stratify Legal Discovery服务。

成为VIP会员查看完整内容
0
22

教程题目:Computational Analysis of Political Texts: Bridging Research Efforts Across Communities

教程简介

使用计算方法来研究政治文本的范围急剧扩大,使政治科学中的文本即数据社区得以持续增长。NLP方法已被广泛用于许多分析和任务,包括从文本记录中推测某人的政治立场,检测政治文本中的观点,以及分析政治沟通中的文体运用(比如制定政治议程过程中语意模糊性起到的作用)。政治学家创建了资源并使用可用的NLP方法来处理文本数据,这在很大程度上与NLP社区隔离。

与此同时,NLP的研究人员处理了密切相关的任务,如选举预测、意识形态分类和立场检测。这两个社区仍然很大程度上彼此不可知,NLP研究人员大多不知道政治科学中有趣的应用程序和用例,而政治科学家在将前沿NLP方法应用到他们的问题上落后。本教程将全面概述政治文本的计算分析工作。首先查看文本数据在政治分析中所扮演的角色,然后继续研究文本即数据的政治科学社区所处理的具体资源和任务。接下来,介绍NLP社区迄今为止所做的研究工作,重点介绍对政治文本进行专题分析的方法,包括无监督的主题归纳和监督的主题分类研究。最后,以政治文本标度作为本教程的结尾,这是文本数据中意识形态检测的一个具有挑战性的任务,它是定量政治学的核心,最近也引起了NLP学者的注意。

组织者:

GoranGlavaš是德国曼海姆大学博士教授,跨学科研究文本分析初级教授,研究兴趣是词汇和计算语义,信息提取,多语言和跨语言NLP,NLP在社会科学和人文学科中的应用,信息检索。

Federico Nanni是艾伦·图灵研究所的研究数据科学家,是研究工程小组的一员,也是伦敦大学高级研究学院的访问学者。目前研究人文数字、计算社会科学、互联网研究和自然语言处理之间的交叉。

Simone Paolo Ponzetto于2013年2月加入数据与网络科学小组,担任初级教授,并于2016年2月起担任曼海姆大学信息系统III讲座教授。

成为VIP会员查看完整内容
Computational Analysis of Political Texts.pdf
0
3
Top