BERT，GPT-2这些顶尖工具到底该怎么用到我的模型里? - 专知

会员服务 ·

0

BERT，GPT-2这些顶尖工具到底该怎么用到我的模型里?

2019 年 2 月 21 日 专知

【导读】近期的NLP方向，ELMO、GPT、BERT、Transformer-XL、GPT-2，各种预训练语言模型层出不穷，这些模型在各种NLP任务上一次又一次刷新上线，令人心驰神往。但是当小编翻开他们的paper，每一个上面都写着四个大字：“弱者退散”，到底该怎么将这些顶尖工具用到我的模型里呢？答案是Hugging Face的大神们开源的pytorch-pretrained-BERT。

Github 地址：

https://github.com/huggingface/pytorch-pretrained-BERT

编辑报道：

专知-huaiwen

「模型简介」

近期的各种预训练语言模型，横扫各种NLP任务，这里我们介绍三个最火的预训练模型：

BERT，由Google AI团队，发表于2018年10月11日。它的文章是： BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding。
Transformer-XL, 由Google AI和Carnegie Mellon大学，发表于2019年1月9日。它的文章是：Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context。
GPT-2，由OpenAI 团队，发表于2019年2月14日，它的文章是：Language Models are Unsupervised Multitask Learners。

基本上，每一个文章，都在发表的时候，刷新当时的几乎所有NLP任务的State-of-the-Art，然后引发一波热潮。当然，目前风头正盛的是GPT-2，它前几天刚发表。

「开源实现」

然而，让小编翻开他们的paper，发现每一个上面都写着四个大字：“弱者退散”，到底该怎么将这些顶尖工具用到我的模型里呢，Hugging Face 的大神们，紧跟前沿，将所有的预训练语言模型都实现并开源了。更令人钦佩的是，它们还做了很多封装，让大家都可以才在这些巨人模型的肩膀上。

Hugging Face开源的库叫pytorch-pretained-bert, 你可以在本文开头找到链接。接下来的部分，我们介绍一下它的安装和使用。

「安装使用」

你可以直接使用 Pip install 来安装它：

pip install pytorch-pretrained-bert

pytorch-pretrained-bert 内 BERT，GPT，Transformer-XL，GPT-2。

为了获取一句话的BERT表示，我们可以：

拿到表示之后，我们可以在后面，接上自己的模型，比如NER。

我们也可以获取GPT的表示：

Transformer-XL表示：

以及，非常火的，GPT-2的表示：

有了这些表示，我们可以在后面，接入自己的模型，比如：

文本分类

https://github.com/huggingface/pytorch-pretrained-BERT/blob/master/examples/run_classifier.py

阅读理解

https://github.com/huggingface/pytorch-pretrained-BERT/blob/master/examples/run_squad.py

语言模型

https://github.com/huggingface/pytorch-pretrained-BERT/blob/master/examples/run_lm_finetuning.py

等等

-END-

专 · 知

专知《深度学习:算法到实战》课程全部完成！480+位同学在学习，现在报名，限时优惠！网易云课堂人工智能畅销榜首位！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程视频资料和与专家交流咨询！

请加专知小助手微信（扫一扫如下二维码添加），加入专知人工智能主题群，咨询《深度学习:算法到实战》课程，咨询技术商务合作~

请PC登录www.zhuanzhi.ai或者点击阅读原文，注册登录专知，获取更多AI知识资料！

点击“阅读原文”，了解报名专知《深度学习:算法到实战》课程

登录查看更多

6

相关内容

GPT-2

【斯坦福大学AI】BERT, ELMo， & GPT-2:上下文化的单词表示是怎样的?

专知会员服务

35+阅读 · 2020年3月28日

【Amazon】使用预先训练的Transformer模型进行数据增强，Data Augmentation using Pre-trained Transformer Models

【Amazon】使用预先训练的Transformer模型进行数据增强，Data Augmentation using Pre-trained Transformer Models

专知会员服务

51+阅读 · 2020年3月7日

预训练语言模型究竟捕获了什么？（oLMpics - On what Language Model Pre-training Captures）

预训练语言模型究竟捕获了什么？（oLMpics - On what Language Model Pre-training Captures）

专知会员服务

14+阅读 · 2020年1月3日

BERT进展2019四篇必读论文

BERT进展2019四篇必读论文

专知会员服务

70+阅读 · 2020年1月2日

【文章|BERT三步使用NLP迁移学习】NLP Transfer Learning In 3 Steps

【文章|BERT三步使用NLP迁移学习】NLP Transfer Learning In 3 Steps

专知会员服务

51+阅读 · 2019年11月26日

最强NLP预训练模型库PyTorch-Transformers正式开源！支持6个预训练框架，27个预训练模型

最强NLP预训练模型库PyTorch-Transformers正式开源！支持6个预训练框架，27个预训练模型

AI前线

12+阅读 · 2019年7月22日

BERT、GPT-2这些顶尖工具到底该怎么用到我的模型里?

BERT、GPT-2这些顶尖工具到底该怎么用到我的模型里?

新智元

44+阅读 · 2019年2月22日

加入Transformer-XL，这个PyTorch包能调用各种NLP预训练模型

加入Transformer-XL，这个PyTorch包能调用各种NLP预训练模型

机器之心

15+阅读 · 2019年2月13日

NLP - 基于 BERT 的中文命名实体识别（NER)

NLP - 基于 BERT 的中文命名实体识别（NER)

AINLP

466+阅读 · 2019年2月10日

推出一个半月，斯坦福SQuAD问答榜单前六名都在使用BERT

推出一个半月，斯坦福SQuAD问答榜单前六名都在使用BERT

机器之心

11+阅读 · 2018年11月26日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

How to Fine-Tune BERT for Text Classification?

How to Fine-Tune BERT for Text Classification?

Arxiv

13+阅读 · 2019年5月14日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context

Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context

Arxiv

4+阅读 · 2019年1月9日

Conditional BERT Contextual Augmentation

Conditional BERT Contextual Augmentation

Arxiv

8+阅读 · 2018年12月17日

VIP会员

相关主题

预训练语言模型

相关VIP内容

【斯坦福大学AI】BERT, ELMo， & GPT-2:上下文化的单词表示是怎样的?

专知会员服务

35+阅读 · 2020年3月28日

【Amazon】使用预先训练的Transformer模型进行数据增强，Data Augmentation using Pre-trained Transformer Models

【Amazon】使用预先训练的Transformer模型进行数据增强，Data Augmentation using Pre-trained Transformer Models

专知会员服务

51+阅读 · 2020年3月7日

预训练语言模型究竟捕获了什么？（oLMpics - On what Language Model Pre-training Captures）

预训练语言模型究竟捕获了什么？（oLMpics - On what Language Model Pre-training Captures）

专知会员服务

14+阅读 · 2020年1月3日

BERT进展2019四篇必读论文

BERT进展2019四篇必读论文

专知会员服务

70+阅读 · 2020年1月2日

【文章|BERT三步使用NLP迁移学习】NLP Transfer Learning In 3 Steps

【文章|BERT三步使用NLP迁移学习】NLP Transfer Learning In 3 Steps

专知会员服务

51+阅读 · 2019年11月26日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体工程（Agent Engineering）

《全球地缘政治环境中的反无人机系统互操作性》252页

专业软件开发者不靠“氛围编程”（Vibe Coding），而靠“控制”：2025 年 AI Agent 在编程中的应用研究

基于大语言模型的智能体化软件问题解决：综述

相关资讯

最强NLP预训练模型库PyTorch-Transformers正式开源！支持6个预训练框架，27个预训练模型

最强NLP预训练模型库PyTorch-Transformers正式开源！支持6个预训练框架，27个预训练模型

AI前线

12+阅读 · 2019年7月22日

BERT、GPT-2这些顶尖工具到底该怎么用到我的模型里?

BERT、GPT-2这些顶尖工具到底该怎么用到我的模型里?

新智元

44+阅读 · 2019年2月22日

加入Transformer-XL，这个PyTorch包能调用各种NLP预训练模型

加入Transformer-XL，这个PyTorch包能调用各种NLP预训练模型

机器之心

15+阅读 · 2019年2月13日

NLP - 基于 BERT 的中文命名实体识别（NER)

NLP - 基于 BERT 的中文命名实体识别（NER)

AINLP

466+阅读 · 2019年2月10日

推出一个半月，斯坦福SQuAD问答榜单前六名都在使用BERT

推出一个半月，斯坦福SQuAD问答榜单前六名都在使用BERT

机器之心

11+阅读 · 2018年11月26日

相关论文

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

How to Fine-Tune BERT for Text Classification?

How to Fine-Tune BERT for Text Classification?

Arxiv

13+阅读 · 2019年5月14日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context

Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context

Arxiv

4+阅读 · 2019年1月9日

Conditional BERT Contextual Augmentation

Conditional BERT Contextual Augmentation

Arxiv

8+阅读 · 2018年12月17日

大家都在搜

大型语言模型

蓝牙安全攻防

分布式事务

GitHub上已超过

微信扫码咨询专知VIP会员