本周六定位上海!解析百度文心(ERNIE)如何助力快速定制企业级NLP模型

2020 年 10 月 23 日 PaperWeekly


文心(ERNIE)是依托百度深度学习平台飞桨打造的语义理解技术与平台,集先进的预训练模型、全面的NLP算法集、端到端开发套件和平台化服务于一体,为企业和开发者提供一整套NLP定制与应用能力。在2020世界人工智能大会,百度文心(ERNIE)荣获最高奖项SAIL奖(Super AI Leader,卓越人工智能引领者)。

 

ERNIE开创性地将大数据预训练与多源丰富知识相结合,持续学习海量数据中的知识,将机器语义理解水平提升到一个新的高度。以中文模型为例,目前ERNIE已经学习了1500万篇百科语料和词语、实体知识,700万个人类对话,3亿的文章的因果结构关系,以及10亿次的搜索查询与结果的对应关系,以及2000万的语言逻辑关系知识。模型还在持续不断地建模新的海量数据与知识,不断地提升下游的应用效果。ERNIE在中英文的16个任务上已经超越了业界最好模型,全面适用于各类NLP应用场景。

 

目前,EasyDL已预置了领先的预训练模型ERNIE2.0,并配套了多种NLP经典算法网络,支持了文本分类、短文本匹配和序列标注等典型文本处理任务。


近日,文心(ERNIE)重磅发布三项功能,新增定制多标签文本分类、情感倾向分析、文本实体抽取模型等功能,同时数据管理能力也进一步增强,更好地满足NLP领域开发者需求,开发者可通过百度AI开发平台EasyDL进行使用。


EasyDL是百度大脑面向企业开发者推出的零门槛AI开发平台,基于百度自主研发的深度学习平台飞桨,结合业界先进的工程服务技术打造,覆盖视觉与自然语言处理两大技术方向,支持一站式智能标注、模型训练、服务部署等全流程功能。目前EasyDL已经被广泛应用在零售、互联网、安全生产、工业质检、教育、医疗、交通等20多个行业,拥有70多万用户。


使用EasyDL简单三步即可完成NLP任务配置与训练,性能优异。



那么,文心这么厉害,有没有机会和高工面对面,快速掌握技术原理与实际应用?


本周六,百度资深研发工程师空降上海,一个上午从文心(ERNIE)技术解析到实战演练为你解析如何定制企业高精度NLP模型。(文末海报报名哦)


我们先来点技术干货稍做预习,了解下文心(ERNIE)近期重磅上线的多项实用功能!


 新增定制化多标签文本分类功能 

 

“多标签文本分类”指对一段文本同时标记多个标签,如:“未来的学和教正在发生颠覆,学生将会在家里学习,机器人将走上讲台。”可对应标签为“教育”、“科技”。该功能应用场景广泛,如媒体场景中对新闻内容进行自动归类,在内容推荐场景中利用内容标签提升召回,通过自动标签功能对知识文档进行多层级分类等。 


目前,EasyDL平台经典版和专业版均新增了这项功能,在“专业版”的任务配置过程中,开发者还可选择ERNIE Tiny、ERNIE Large、ERNIE Base三种各有所长的预训练模型。




 新增定制化情感倾向分析功能 

 

“情感倾向分析”指对一段文本进行“积极情感”或“消极情感”的判断,如“酒店位置很好,服务周到热情,下次一定会再来”的用户评价,部署模型后可直接得到“Positive(积极情感)”的标签和99%的置信度。


该功能最常应用于用户评论分析和舆情分析,比如商品、店铺的口碑分析,对事实性的新闻事件或互联网话题进行舆情分析等,在汽车、餐饮、酒店等多个垂类上,分析准确率可达到95%以上。


目前,该功能已经上线EasyDL经典版,后续平台将逐步增加基于实体级和句子级的情感分类,力求覆盖更多的应用需求。



 文本数据管理和数据标注功能全面升级 

 

针对开发者数据管理和数据标注过程中的痛点,EasyDL支持了更加灵活的数据格式,当前可支持zip、Excel、TXT三种文件格式进行上传。除了提供在线标注能力外,还提供智能标注功能,大幅降低了开发者的标注成本,开发者可直接上传未标注数据体验该功能。


图:文本智能标注示意图

 

10月24日当天,百度AI快车道【飞桨开源框架高阶营】线下课程 “闪现” 上海站,邀请 “魔都程序猿” 和 “沪上程序媛” 来到上海市徐汇区瑞平路230号保利时光里B1-09——LOFAS集聚空间,与百度资深高工、各位行业开发者相聚一堂。上海站内容绝对不会令你 “空脑而归”,开发全流程、部署工具、高精度目标检测、模型优化方案一一奉上,更有“全能”OCR、金牌推荐算法,一起来场硬核趴体吧! 


想了解强大文心(ERNIE)背后的技术原理? 


想更进一步快速掌握NLP模型开发方法与技巧? 


想线下和百度资深研发与各行业开发者深度沟通? 


本周六上午,就在上海徐汇区复兴路1199号A座5层,百度AI快车道【EasyDL零门槛模型训练营】,资深研发工程师详解NLP技术能力,并带来现场实操与面对面答疑解惑,助你三小时掌握EasyDL的NLP模型开发秘籍!



点击阅读原文即可体验!



🔍


现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧



关于PaperWeekly


PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。



登录查看更多
0

相关内容

NLP:自然语言处理
企业风险知识图谱的构建及应用
专知会员服务
94+阅读 · 2020年11月6日
基于改进卷积神经网络的短文本分类模型
专知会员服务
25+阅读 · 2020年7月22日
面向司法案件的案情知识图谱自动构建
专知会员服务
122+阅读 · 2020年4月17日
NLP基础任务:文本分类近年发展汇总,68页超详细解析
专知会员服务
57+阅读 · 2020年1月3日
一文读懂最强中文NLP预训练模型ERNIE
AINLP
24+阅读 · 2019年10月22日
【工业互联网】数字化模型是工业PaaS平台的核心
产业智能官
5+阅读 · 2019年6月2日
招聘|国内语义理解最好企业「三角兽」招贤纳士
机器人大讲堂
3+阅读 · 2018年11月12日
干货篇|百度UNIT对话系统核心技术解析
InfoQ
23+阅读 · 2018年9月20日
最全面的百度NLP自然语言处理技术解析
InfoQ
7+阅读 · 2017年11月12日
百度NLP模块使用手册--深度直击最新进展
InfoQ
20+阅读 · 2017年10月30日
Arxiv
19+阅读 · 2020年12月23日
VIP会员
Top
微信扫码咨询专知VIP会员