Facebook PyText 在 Github 上开源了

2018 年 12 月 14 日 AINLP
Facebook PyText 在 Github 上开源了

前些天留下的悬念,现在已经开放了,基于PyTorch的深度学习NLP框架,github地址,点击阅读原文可直达:


https://github.com/facebookresearch/pytext





A natural language modeling framework based on PyTorch


PyText is a deep-learning based NLP modeling framework built on PyTorch. PyText addresses the often-conflicting requirements of enabling rapid experimentation and of serving models at scale. It achieves this by providing simple and extensible interfaces and abstractions for model components, and by using PyTorch’s capabilities of exporting models for inference via the optimized Caffe2 execution engine. We are using PyText in Facebook to iterate quickly on new modeling ideas and then seamlessly ship them at scale.


Core PyText features:

  • Production ready models for various NLP/NLU tasks:

    • Zhang et al. (2016): A Joint Model of Intent Determination and Slot Filling for Spoken Language Understanding

    • Lample et al. (2016): Neural Architectures for Named Entity Recognition

    • Yoon Kim (2014): Convolutional Neural Networks for Sentence Classification

    • Lin et al. (2017): A Structured Self-attentive Sentence Embedding

    • Text classifiers

    • Sequence taggers

    • Joint intent-slot model

    • Contextual intent-slot models

  • Distributed-training support built on the new C10d backend in PyTorch 1.0

  • Extensible components that allows easy creation of new models and tasks

  • Reference implementation and a pretrained model for the paper: Gupta et al. (2018): Semantic Parsing for Task Oriented Dialog using Hierarchical Representations

  • Ensemble training support

Installing PyText

To get started on a Cloud VM, checkout our guide

We recommend using a virtualenv:

  $ python3 -m virtualenv venv
  $ source pytext/bin/activate
  (venv) $ pip install pytext-nlp

Detailed instructions can be found in our Documentation

Train your first text classifier

For this first example, we'll train a CNN-based text-classifier that classifies text utterances, using the examples in tests/data/train_data_tiny.tsv.

  (venv) $ pytext train < demo/configs/docnn.json

By default, the model is created in /tmp/model.pt

Now you can export your model as a caffe2 net:

  (venv) $ pytext export < config.json

You can use the exported caffe2 model to predict the class of raw utterances like this:

  (venv) $ pytext --config-file config.json predict <<< '{"raw_text": "create an alarm for 1:30 pm"}'

License

PyText is BSD-licensed, as found in the LICENSE file.



登录查看更多
6

相关内容

小贴士
相关资讯
2019热门开源机器学习项目汇总
专知
9+阅读 · 2020年1月3日
基于PyTorch/TorchText的自然语言处理库
专知
26+阅读 · 2019年4月22日
2018机器学习开源资源盘点
专知
6+阅读 · 2019年2月2日
TorchSeg:基于pytorch的语义分割算法开源了
极市平台
19+阅读 · 2019年1月28日
Github项目推荐 | RecQ - Python推荐系统框架
AI研习社
8+阅读 · 2019年1月23日
推荐 | 机器学习开源项目 Top 10
AI100
3+阅读 · 2018年3月21日
【推荐】MXNet深度情感分析实战
机器学习研究会
16+阅读 · 2017年10月4日
相关VIP内容
专知会员服务
44+阅读 · 2020年3月19日
专知会员服务
99+阅读 · 2020年3月12日
专知会员服务
43+阅读 · 2020年2月26日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
46+阅读 · 2020年2月18日
一网打尽!100+深度学习模型TensorFlow与Pytorch代码实现集合
2019年机器学习框架回顾
专知会员服务
27+阅读 · 2019年10月11日
计算机视觉最佳实践、代码示例和相关文档
专知会员服务
9+阅读 · 2019年10月9日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
24+阅读 · 2019年10月9日
相关论文
Le Yang,Yizeng Han,Xi Chen,Shiji Song,Jifeng Dai,Gao Huang
5+阅读 · 2020年3月16日
Malte Ostendorff,Peter Bourgonje,Maria Berger,Julian Moreno-Schneider,Georg Rehm,Bela Gipp
5+阅读 · 2019年9月18日
Hoang NT,Takanori Maehara
7+阅读 · 2019年5月23日
Data Augmentation of Room Classifiers using Generative Adversarial Networks
Constantinos Papayiannis,Christine Evers,Patrick A. Naylor
4+阅读 · 2019年1月10日
Xi Victoria Lin,Richard Socher,Caiming Xiong
5+阅读 · 2018年9月11日
Dissecting Contextual Word Embeddings: Architecture and Representation
Matthew E. Peters,Mark Neumann,Luke Zettlemoyer,Wen-tau Yih
21+阅读 · 2018年8月27日
Are Generative Classifiers More Robust to Adversarial Attacks?
Yingzhen Li,John Bradshaw,Yash Sharma
4+阅读 · 2018年7月9日
Adversarial Reprogramming of Neural Networks
Gamaleldin F. Elsayed,Ian Goodfellow,Jascha Sohl-Dickstein
3+阅读 · 2018年6月28日
Felix Hieber,Tobias Domhan,Michael Denkowski,David Vilar,Artem Sokolov,Ann Clifton,Matt Post
7+阅读 · 2018年6月1日
Adams Wei Yu,David Dohan,Minh-Thang Luong,Rui Zhao,Kai Chen,Mohammad Norouzi,Quoc V. Le
3+阅读 · 2018年4月23日
Top