面试题：预训练方法 BERT和OpenAI GPT有什么区别？ - 专知

会员服务 ·

0

面试题：预训练方法 BERT和OpenAI GPT有什么区别？

2019 年 5 月 15 日 七月在线实验室

阅读原文无聊的猫gif动图

BERT和OpenAI GPT有什么区别？

解析：

1.GPT在BooksCorpus(800M单词)训练；BERT在BooksCorpus(800M单词)和维基百科(2,500M单词)训练

2.GPT使用一种句子分隔符([SEP])和分类符词块([CLS])，它们仅在微调时引入；BERT在预训练期间学习[SEP]，[CLS]和句子A/B嵌入

3.GPT用一个批量32,000单词训练1M步；BERT用一个批量128,000单词训练1M步

4.GPT对所有微调实验使用的5e-5相同学习率；BERT选择特定于任务的微调学习率，在开发集表现最佳

想从传统IT行业转行AI？

担心转行失败？

再也不用怕了！

就业班来了

学员都在3个月内找到满意工作

依据个人情况定制化教学

四大方向量身定制

定制学习路线

名企面试官亲自辅导面试

分享课程拿现金红包！

领的人越多，你拿的越多！

快来扫它

他用机器学习减肥20斤！程序员必看，你想不到的机器学习妙用

毕业/转行就拿50万+年薪！15位同学经验分享，他们怎么做到的？

福利时间

后台回复：“100” 免费领【机器学习面试100题】

后台回复：“干货” 免费领【全体系人工智能学习资料】

后台回复：“领资料” 免费领【NLP工程师必备干货资料】

戳 “阅读原文”你来决定未来的内容

你在看吗？

登录查看更多

15

相关内容

BERT

BERT全称Bidirectional Encoder Representations from Transformers，是预训练语言表示的方法，可以在大型文本语料库（如维基百科）上训练通用的“语言理解”模型，然后将该模型用于下游NLP任务，比如机器翻译、问答。

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

专知会员服务

99+阅读 · 2020年7月3日

【ACL2020-Google】BLEURT:一种基于迁移学习的自然语言生成度量

【ACL2020-Google】BLEURT:一种基于迁移学习的自然语言生成度量

专知会员服务

20+阅读 · 2020年5月12日

史上机器学习 &深度学习课程大合集，一站搞定，Deep Learning Drizzle

史上机器学习 &深度学习课程大合集，一站搞定，Deep Learning Drizzle

专知会员服务

175+阅读 · 2020年5月10日

Google BERT作者Jacob斯坦福亲授《上下文词向量与预训练语言模型: BERT到T5》43页ppt

Google BERT作者Jacob斯坦福亲授《上下文词向量与预训练语言模型: BERT到T5》43页ppt

专知会员服务

91+阅读 · 2020年4月6日

【斯坦福大学AI】BERT, ELMo， & GPT-2:上下文化的单词表示是怎样的?

专知会员服务

35+阅读 · 2020年3月28日

【预训练论文】预训练Transformer校准，Calibration of Pre-trained Transformers

【预训练论文】预训练Transformer校准，Calibration of Pre-trained Transformers

专知会员服务

26+阅读 · 2020年3月19日

【跨语言BERT模型大集合】Transfer learning is increasingly going multilingual with language-specific BERT models

专知会员服务

54+阅读 · 2020年1月30日

预训练语言模型BERT，Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑，35页ppt

预训练语言模型BERT，Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑，35页ppt

专知会员服务

112+阅读 · 2020年1月7日

【机器学习课程】Google机器学习速成课程

【机器学习课程】Google机器学习速成课程

专知会员服务

169+阅读 · 2019年12月2日

【文章|BERT三步使用NLP迁移学习】NLP Transfer Learning In 3 Steps

【文章|BERT三步使用NLP迁移学习】NLP Transfer Learning In 3 Steps

专知会员服务

51+阅读 · 2019年11月26日

虽被BERT碾压，但还是有必要谈谈BERT时代与后时代的NLP

虽被BERT碾压，但还是有必要谈谈BERT时代与后时代的NLP

AI100

4+阅读 · 2019年6月27日

超越 BERT 和 GPT，微软亚洲研究院开源新模型 MASS！

超越 BERT 和 GPT，微软亚洲研究院开源新模型 MASS！

雷锋网

10+阅读 · 2019年6月27日

面试题：文本摘要中的NLP技术

面试题：文本摘要中的NLP技术

七月在线实验室

15+阅读 · 2019年5月13日

BERT一作Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑

BERT一作Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑

专知

49+阅读 · 2019年3月7日

对标Bert？刷屏的GPT 2.0意味着什么

对标Bert？刷屏的GPT 2.0意味着什么

AI100

4+阅读 · 2019年2月16日

GLUE排行榜上全面超越BERT的模型近日公布了！

GLUE排行榜上全面超越BERT的模型近日公布了！

机器之心

9+阅读 · 2019年2月13日

预训练在自然语言处理的发展: 从Word Embedding到BERT模型

预训练在自然语言处理的发展: 从Word Embedding到BERT模型

AINLP

16+阅读 · 2018年11月9日

深度学习面试100题（第81-85题）

深度学习面试100题（第81-85题）

七月在线实验室

17+阅读 · 2018年8月6日

深度学习面试100题（第76-80题）

深度学习面试100题（第76-80题）

七月在线实验室

6+阅读 · 2018年8月3日

机器学习大礼包 | 课程、数据集、面试题, 自学资源免费送!

机器学习大礼包 | 课程、数据集、面试题, 自学资源免费送!

九章算法

5+阅读 · 2018年3月3日

Pre-training Text Representations as Meta Learning

Arxiv

13+阅读 · 2020年4月12日

A Primer in BERTology: What we know about how BERT works

A Primer in BERTology: What we know about how BERT works

Arxiv

34+阅读 · 2020年2月27日

Multi-Stage Document Ranking with BERT

Arxiv

5+阅读 · 2019年10月31日

DocBERT: BERT for Document Classification

Arxiv

6+阅读 · 2019年8月22日

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Arxiv

16+阅读 · 2019年5月24日

How to Fine-Tune BERT for Text Classification?

How to Fine-Tune BERT for Text Classification?

Arxiv

13+阅读 · 2019年5月14日

BioBERT: a pre-trained biomedical language representation model for biomedical text mining

BioBERT: a pre-trained biomedical language representation model for biomedical text mining

Arxiv

7+阅读 · 2019年2月3日

Conditional BERT Contextual Augmentation

Conditional BERT Contextual Augmentation

Arxiv

8+阅读 · 2018年12月17日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Deep Gaussian Embedding of Graphs: Unsupervised Inductive Learning via Ranking

Arxiv

5+阅读 · 2018年2月27日

VIP会员

相关主题

相关VIP内容

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

专知会员服务

99+阅读 · 2020年7月3日

【ACL2020-Google】BLEURT:一种基于迁移学习的自然语言生成度量

【ACL2020-Google】BLEURT:一种基于迁移学习的自然语言生成度量

专知会员服务

20+阅读 · 2020年5月12日

史上机器学习 &深度学习课程大合集，一站搞定，Deep Learning Drizzle

史上机器学习 &深度学习课程大合集，一站搞定，Deep Learning Drizzle

专知会员服务

175+阅读 · 2020年5月10日

Google BERT作者Jacob斯坦福亲授《上下文词向量与预训练语言模型: BERT到T5》43页ppt

Google BERT作者Jacob斯坦福亲授《上下文词向量与预训练语言模型: BERT到T5》43页ppt

专知会员服务

91+阅读 · 2020年4月6日

【斯坦福大学AI】BERT, ELMo， & GPT-2:上下文化的单词表示是怎样的?

专知会员服务

35+阅读 · 2020年3月28日

【预训练论文】预训练Transformer校准，Calibration of Pre-trained Transformers

【预训练论文】预训练Transformer校准，Calibration of Pre-trained Transformers

专知会员服务

26+阅读 · 2020年3月19日

【跨语言BERT模型大集合】Transfer learning is increasingly going multilingual with language-specific BERT models

专知会员服务

54+阅读 · 2020年1月30日

预训练语言模型BERT，Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑，35页ppt

预训练语言模型BERT，Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑，35页ppt

专知会员服务

112+阅读 · 2020年1月7日

【机器学习课程】Google机器学习速成课程

【机器学习课程】Google机器学习速成课程

专知会员服务

169+阅读 · 2019年12月2日

【文章|BERT三步使用NLP迁移学习】NLP Transfer Learning In 3 Steps

【文章|BERT三步使用NLP迁移学习】NLP Transfer Learning In 3 Steps

专知会员服务

51+阅读 · 2019年11月26日

热门VIP内容

开通专知VIP会员享更多权益服务

【ACL2025教程】大语言模型的护栏与安全性：对其应用的安全、可靠与可控引导

《实现协同自主：从人机协作到多智能体系统》最新190页

【ICML2025】SToFM：一种用于空间转录组学的多尺度基础模型

通信网络智能体白皮书V1.0，61页pdf

相关资讯

虽被BERT碾压，但还是有必要谈谈BERT时代与后时代的NLP

虽被BERT碾压，但还是有必要谈谈BERT时代与后时代的NLP

AI100

4+阅读 · 2019年6月27日

超越 BERT 和 GPT，微软亚洲研究院开源新模型 MASS！

超越 BERT 和 GPT，微软亚洲研究院开源新模型 MASS！

雷锋网

10+阅读 · 2019年6月27日

面试题：文本摘要中的NLP技术

面试题：文本摘要中的NLP技术

七月在线实验室

15+阅读 · 2019年5月13日

BERT一作Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑

BERT一作Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑

专知

49+阅读 · 2019年3月7日

对标Bert？刷屏的GPT 2.0意味着什么

对标Bert？刷屏的GPT 2.0意味着什么

AI100

4+阅读 · 2019年2月16日

GLUE排行榜上全面超越BERT的模型近日公布了！

GLUE排行榜上全面超越BERT的模型近日公布了！

机器之心

9+阅读 · 2019年2月13日

预训练在自然语言处理的发展: 从Word Embedding到BERT模型

预训练在自然语言处理的发展: 从Word Embedding到BERT模型

AINLP

16+阅读 · 2018年11月9日

深度学习面试100题（第81-85题）

深度学习面试100题（第81-85题）

七月在线实验室

17+阅读 · 2018年8月6日

深度学习面试100题（第76-80题）

深度学习面试100题（第76-80题）

七月在线实验室

6+阅读 · 2018年8月3日

机器学习大礼包 | 课程、数据集、面试题, 自学资源免费送!

机器学习大礼包 | 课程、数据集、面试题, 自学资源免费送!

九章算法

5+阅读 · 2018年3月3日

相关论文

Pre-training Text Representations as Meta Learning

Arxiv

13+阅读 · 2020年4月12日

A Primer in BERTology: What we know about how BERT works

A Primer in BERTology: What we know about how BERT works

Arxiv

34+阅读 · 2020年2月27日

Multi-Stage Document Ranking with BERT

Arxiv

5+阅读 · 2019年10月31日

DocBERT: BERT for Document Classification

Arxiv

6+阅读 · 2019年8月22日

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Arxiv

16+阅读 · 2019年5月24日

How to Fine-Tune BERT for Text Classification?

How to Fine-Tune BERT for Text Classification?

Arxiv

13+阅读 · 2019年5月14日

BioBERT: a pre-trained biomedical language representation model for biomedical text mining

BioBERT: a pre-trained biomedical language representation model for biomedical text mining

Arxiv

7+阅读 · 2019年2月3日

Conditional BERT Contextual Augmentation

Conditional BERT Contextual Augmentation

Arxiv

8+阅读 · 2018年12月17日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Deep Gaussian Embedding of Graphs: Unsupervised Inductive Learning via Ranking

Arxiv

5+阅读 · 2018年2月27日

大家都在搜

软件无线电

大型语言模型

生成式人工智能

国防科技创新

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员