【斯坦福CS224N硬核课】Transformers模型详解，50页ppt - 专知

会员服务 ·

0

【斯坦福CS224N硬核课】Transformers模型详解，50页ppt

2021 年 2 月 16 日 专知

注意力（Attention）机制[2]由Bengio团队与2014年提出并在近年广泛的应用在深度学习中的各个领域，例如在计算机视觉方向用于捕捉图像上的感受野，或者NLP中用于定位关键token或者特征。谷歌团队近期提出的用于生成词向量的BERT[3]算法在NLP的11项任务中取得了效果的大幅提升，堪称2018年深度学习领域最振奋人心的消息。而BERT算法的最重要的部分便是本文中提出的Transformer的概念。

正如论文的题目所说的，Transformer中抛弃了传统的CNN和RNN，整个网络结构完全是由Attention机制组成。更准确地讲，Transformer由且仅由self-Attenion和Feed Forward Neural Network组成。一个基于Transformer的可训练的神经网络可以通过堆叠Transformer的形式进行搭建，作者的实验是通过搭建编码器和解码器各6层，总共12层的Encoder-Decoder，并在机器翻译中取得了BLEU值得新高。

http://web.stanford.edu/class/cs224n/index.html#schedule

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“T50” 可以获取《【斯坦福CS224N硬核课】Transformers模型详解，50页ppt》专知下载链接索引

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

1

相关内容

CS224N

CS224N来了！斯坦福经典《自然语言处理》2021课程开讲！Manning、陈丹琦讲座

CS224N来了！斯坦福经典《自然语言处理》2021课程开讲！Manning、陈丹琦讲座

专知会员服务

69+阅读 · 2021年11月5日

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

专知会员服务

61+阅读 · 2021年3月15日

【斯坦福CS224N硬核课】如何融合知识到语言模型中，60页ppt

【斯坦福CS224N硬核课】如何融合知识到语言模型中，60页ppt

专知会员服务

61+阅读 · 2021年3月8日

【斯坦福CS224N硬核课】问答系统，陈丹琦讲解，79页ppt

【斯坦福CS224N硬核课】问答系统，陈丹琦讲解，79页ppt

专知会员服务

74+阅读 · 2021年2月23日

【斯坦福CS224N硬核课】自然语言生成NLG，79页ppt

专知会员服务

37+阅读 · 2021年2月22日

【斯坦福CS224W】知识图谱推理，84页ppt

【斯坦福CS224W】知识图谱推理，84页ppt

专知会员服务

121+阅读 · 2021年2月19日

【斯坦福CS224W】知识图谱嵌入，77页ppt

专知会员服务

67+阅读 · 2021年2月17日

【斯坦福CS224w图机器学习第6讲】图神经网络模型概述总结，67页ppt

【斯坦福CS224w图机器学习第6讲】图神经网络模型概述总结，67页ppt

专知会员服务

58+阅读 · 2021年1月31日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知会员服务

107+阅读 · 2020年8月30日

【ST2020硬核课】深度神经网络，57页ppt

【ST2020硬核课】深度神经网络，57页ppt

专知会员服务

48+阅读 · 2020年8月19日

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

专知

24+阅读 · 2020年6月11日

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

专知

10+阅读 · 2020年6月10日

【Facebook AI】低资源机器翻译，74页ppt

【Facebook AI】低资源机器翻译，74页ppt

专知

10+阅读 · 2020年4月8日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知

50+阅读 · 2020年3月1日

普林斯顿大学陈丹琦主讲COS484: 自然语言处理课程

普林斯顿大学陈丹琦主讲COS484: 自然语言处理课程

专知

6+阅读 · 2019年12月11日

(2019)斯坦福CS224n深度学习自然语言处理课程(已开放Slides)

(2019)斯坦福CS224n深度学习自然语言处理课程(已开放Slides)

专知

15+阅读 · 2019年3月15日

BERT一作Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑

BERT一作Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑

专知

49+阅读 · 2019年3月7日

39页《迁移学习自然语言生成》PPT

39页《迁移学习自然语言生成》PPT

专知

9+阅读 · 2019年2月13日

斯坦福2019《CS230：深度学习》开课，吴恩达带队授课

斯坦福2019《CS230：深度学习》开课，吴恩达带队授课

专知

17+阅读 · 2019年1月12日

斯坦福2019《CS224n:自然语言处理深度学习》开课，Christopher Manning带队授课

斯坦福2019《CS224n:自然语言处理深度学习》开课，Christopher Manning带队授课

专知

12+阅读 · 2019年1月6日

Fourier Image Transformer

Arxiv

0+阅读 · 2021年5月3日

Larger-Scale Transformers for Multilingual Masked Language Modeling

Arxiv

0+阅读 · 2021年5月2日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

Relation-Aware Graph Attention Network for Visual Question Answering

Relation-Aware Graph Attention Network for Visual Question Answering

Arxiv

7+阅读 · 2019年10月9日

How to Fine-Tune BERT for Text Classification?

How to Fine-Tune BERT for Text Classification?

Arxiv

13+阅读 · 2019年5月14日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

Universal Transformers

Universal Transformers

Arxiv

5+阅读 · 2019年3月5日

Improving the Transformer Translation Model with Document-Level Context

Arxiv

4+阅读 · 2018年10月8日

VIP会员

相关主题

计算机科学

注意力机制

相关VIP内容

CS224N来了！斯坦福经典《自然语言处理》2021课程开讲！Manning、陈丹琦讲座

CS224N来了！斯坦福经典《自然语言处理》2021课程开讲！Manning、陈丹琦讲座

专知会员服务

69+阅读 · 2021年11月5日

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

专知会员服务

61+阅读 · 2021年3月15日

【斯坦福CS224N硬核课】如何融合知识到语言模型中，60页ppt

【斯坦福CS224N硬核课】如何融合知识到语言模型中，60页ppt

专知会员服务

61+阅读 · 2021年3月8日

【斯坦福CS224N硬核课】问答系统，陈丹琦讲解，79页ppt

【斯坦福CS224N硬核课】问答系统，陈丹琦讲解，79页ppt

专知会员服务

74+阅读 · 2021年2月23日

【斯坦福CS224N硬核课】自然语言生成NLG，79页ppt

专知会员服务

37+阅读 · 2021年2月22日

【斯坦福CS224W】知识图谱推理，84页ppt

【斯坦福CS224W】知识图谱推理，84页ppt

专知会员服务

121+阅读 · 2021年2月19日

【斯坦福CS224W】知识图谱嵌入，77页ppt

专知会员服务

67+阅读 · 2021年2月17日

【斯坦福CS224w图机器学习第6讲】图神经网络模型概述总结，67页ppt

【斯坦福CS224w图机器学习第6讲】图神经网络模型概述总结，67页ppt

专知会员服务

58+阅读 · 2021年1月31日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知会员服务

107+阅读 · 2020年8月30日

【ST2020硬核课】深度神经网络，57页ppt

【ST2020硬核课】深度神经网络，57页ppt

专知会员服务

48+阅读 · 2020年8月19日

热门VIP内容

开通专知VIP会员享更多权益服务

新质生成式AI赋能产业变革的实践与路径

用于多模态大模型的离散标记化：全面综述

Nature综述：金融网络中的物理学

【CMU博士论文】通信高效且差分隐私的优化方法

相关资讯

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

专知

24+阅读 · 2020年6月11日

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

专知

10+阅读 · 2020年6月10日

【Facebook AI】低资源机器翻译，74页ppt

【Facebook AI】低资源机器翻译，74页ppt

专知

10+阅读 · 2020年4月8日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知

50+阅读 · 2020年3月1日

普林斯顿大学陈丹琦主讲COS484: 自然语言处理课程

普林斯顿大学陈丹琦主讲COS484: 自然语言处理课程

专知

6+阅读 · 2019年12月11日

(2019)斯坦福CS224n深度学习自然语言处理课程(已开放Slides)

(2019)斯坦福CS224n深度学习自然语言处理课程(已开放Slides)

专知

15+阅读 · 2019年3月15日

BERT一作Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑

BERT一作Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑

专知

49+阅读 · 2019年3月7日

39页《迁移学习自然语言生成》PPT

39页《迁移学习自然语言生成》PPT

专知

9+阅读 · 2019年2月13日

斯坦福2019《CS230：深度学习》开课，吴恩达带队授课

斯坦福2019《CS230：深度学习》开课，吴恩达带队授课

专知

17+阅读 · 2019年1月12日

斯坦福2019《CS224n:自然语言处理深度学习》开课，Christopher Manning带队授课

斯坦福2019《CS224n:自然语言处理深度学习》开课，Christopher Manning带队授课

专知

12+阅读 · 2019年1月6日

相关论文

Fourier Image Transformer

Arxiv

0+阅读 · 2021年5月3日

Larger-Scale Transformers for Multilingual Masked Language Modeling

Arxiv

0+阅读 · 2021年5月2日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

Relation-Aware Graph Attention Network for Visual Question Answering

Relation-Aware Graph Attention Network for Visual Question Answering

Arxiv

7+阅读 · 2019年10月9日

How to Fine-Tune BERT for Text Classification?

How to Fine-Tune BERT for Text Classification?

Arxiv

13+阅读 · 2019年5月14日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

Universal Transformers

Universal Transformers

Arxiv

5+阅读 · 2019年3月5日

Improving the Transformer Translation Model with Document-Level Context

Arxiv

4+阅读 · 2018年10月8日

大家都在搜

大型语言模型

CMU博士论文

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员