斯坦福《序列处理的深度学习架构》概述,31页pdf

2021 年 1 月 3 日 专知


语言是一种固有的时间现象。当我们理解和产生口语时,我们处理不确定长度的连续输入流。即使在处理书面文本时,我们通常也按顺序处理。语言的时代性反映在我们使用的隐喻中;我们谈论的是对话流、新闻源和twitter流,所有这些都唤起了这样一种观念:语言是一个随时间展开的序列。这种时间性质反映在我们用来处理语言的算法中。例如,当应用于词性标注问题时,维特比算法每次递增地输入一个单词,并将沿途收集到的信息传递下去。另一方面,我们研究的用于情感分析和其他文本分类任务的机器学习方法没有这种时间性质——它们假设同时访问输入的所有方面。前馈神经网络尤其如此,包括它们在神经语言模型中的应用。这些完全连接的网络使用固定大小的输入,以及相关的权重,一次性捕获示例的所有相关方面。这使得处理不同长度的序列变得困难,并且无法捕捉语言的重要时间方面。


本章涵盖了两个密切相关的深度学习架构,旨在解决这些挑战:循环神经网络和transformer网络。这两种方法都具有直接处理语言的顺序性质的机制,允许它们处理可变长度的输入,而不使用任意固定大小的窗口,并捕获和利用语言的时间性质。


https://web.stanford.edu/~jurafsky/slp3/9.pdf


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“DLASP” 可以获取《斯坦福《序列处理的深度学习架构》概述,31页pdf》专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

专知会员服务
15+阅读 · 2021年4月16日
【斯坦福经典书】机器学习导论,188页pdf
专知会员服务
77+阅读 · 2021年3月31日
自然语言处理现代方法,176页pdf
专知会员服务
263+阅读 · 2021年2月22日
专知会员服务
31+阅读 · 2020年12月23日
专知会员服务
78+阅读 · 2020年12月22日
专知会员服务
135+阅读 · 2020年12月3日
专知会员服务
70+阅读 · 2020年9月20日
专知会员服务
132+阅读 · 2020年8月24日
最新《图理论》笔记书,98页pdf
专知
50+阅读 · 2020年12月27日
最新《图嵌入组合优化》综述论文,40页pdf
【干货书】计算机科学离散数学,627页pdf
专知
54+阅读 · 2020年8月31日
图节点嵌入(Node Embeddings)概述,9页pdf
专知
13+阅读 · 2020年8月22日
多模态深度学习综述,18页pdf
专知
45+阅读 · 2020年3月29日
Arxiv
19+阅读 · 2020年12月23日
Arxiv
3+阅读 · 2020年4月29日
Tutorial on NLP-Inspired Network Embedding
Arxiv
7+阅读 · 2019年10月16日
Arxiv
6+阅读 · 2019年4月8日
VIP会员
相关VIP内容
专知会员服务
15+阅读 · 2021年4月16日
【斯坦福经典书】机器学习导论,188页pdf
专知会员服务
77+阅读 · 2021年3月31日
自然语言处理现代方法,176页pdf
专知会员服务
263+阅读 · 2021年2月22日
专知会员服务
31+阅读 · 2020年12月23日
专知会员服务
78+阅读 · 2020年12月22日
专知会员服务
135+阅读 · 2020年12月3日
专知会员服务
70+阅读 · 2020年9月20日
专知会员服务
132+阅读 · 2020年8月24日
相关资讯
最新《图理论》笔记书,98页pdf
专知
50+阅读 · 2020年12月27日
最新《图嵌入组合优化》综述论文,40页pdf
【干货书】计算机科学离散数学,627页pdf
专知
54+阅读 · 2020年8月31日
图节点嵌入(Node Embeddings)概述,9页pdf
专知
13+阅读 · 2020年8月22日
多模态深度学习综述,18页pdf
专知
45+阅读 · 2020年3月29日
Top
微信扫码咨询专知VIP会员