Keras新增TextVectorization层,可直接将文本字符串作为模型输入

2019 年 11 月 22 日 专知

【导读】Keras作者François Chollet在Twitter上展示了Keras的一个新特性—TextVectorization层。借助该特性,我们可以构建包含文本预处理功能且可直接以字符串作为输入的Keras模型。


在构建NLP深度模型时,我们一般会使用额外的代码对文本进行预处理,将其处理为能够作为深度网络输入的数值型Tensor。虽然对于科研人员来说这并不是什么太大的问题,但对于工程人员来说这是一个较为棘手的问题。在实际工程中,很多情况下我们需要用TensorFlow和Keras等框架生成可被C++ SDK或TensorFlow Serving等调用的模型。并不是整个深度学习流程都可以被保存到这个模型中,尤其是一些用Python写的文本、图像等预处理操作。往往,只有那些与Tensor计算相关的常量、操作等才能被保存到模型中,工程师需要用使用模型的语言(C++、Swift等)重新实现数据预处理等操作。


NLP任务中,将文本预处理问数值Tensor是非常繁琐的过程,你需要额外保存词表、编写转换代码等。工程师需要花费大量的时间精力来理解算法工程师的文本预处理逻辑,才能够准确复现他们的文本预处理流程。


Keras新增的TextVectorization层可以完成文本预处理的逻辑(标准化、词语切分和单词索引),更重要的是,它是可以被序列化和部署的,也就是说,算法工程师可以直接在模型中封装文本预处理的逻辑,而不需要工程师额外的实现。


Keras作者François Chollet在Twitter上展示了该特性:


下面是示例代码链接:

https://colab.research.google.com/drive/1RvCnR7h0_l4Ekn5vINWToI9TNJdpUZB3


-END-
专 · 知


专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询
请加专知小助手微信(扫一扫如下二维码添加),获取专知VIP会员码,加入专知人工智能主题群,咨询技术商务合作~
点击“阅读原文”,了解注册成为专知会员,查看5000+AI主题知识资料
登录查看更多
19

相关内容

【干货书】高级应用深度学习,294页pdf
专知会员服务
149+阅读 · 2020年6月20日
Python导论,476页pdf,现代Python计算
专知会员服务
254+阅读 · 2020年5月17日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
160+阅读 · 2020年5月14日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
136+阅读 · 2020年3月1日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
144+阅读 · 2019年10月12日
【资源】NLP多标签文本分类代码实现工具包
专知
40+阅读 · 2019年11月20日
自然语言处理NLP之旅(NLP文章/代码集锦)
深度学习TensorFlow实现集合
专知
10+阅读 · 2018年9月8日
181页机器学习Python介绍书籍pdf下载
专知
16+阅读 · 2018年8月11日
使用 TensorFlow 做文本情感分析
Datartisan数据工匠
15+阅读 · 2017年11月16日
A Comprehensive Survey on Graph Neural Networks
Arxiv
13+阅读 · 2019年3月10日
Bidirectional Attention for SQL Generation
Arxiv
4+阅读 · 2018年6月21日
Arxiv
6+阅读 · 2018年6月20日
Arxiv
4+阅读 · 2018年2月13日
Arxiv
8+阅读 · 2018年1月19日
Arxiv
9+阅读 · 2016年10月27日
VIP会员
相关VIP内容
【干货书】高级应用深度学习,294页pdf
专知会员服务
149+阅读 · 2020年6月20日
Python导论,476页pdf,现代Python计算
专知会员服务
254+阅读 · 2020年5月17日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
160+阅读 · 2020年5月14日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
136+阅读 · 2020年3月1日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
144+阅读 · 2019年10月12日
Top
微信扫码咨询专知VIP会员