直播 | 明晚八点!清华AAAI录用论文——强化学习在自然语言处理经典问题上的初探

2017 年 11 月 28 日 AI科技评论 连接学术产业的


分享背景

随着强化学习在机器人和游戏AI等领域的成功,该方法也引起了越来越多的关注。本次分享将介绍我们利用强化学习技术,更好地解决自然语言处理中的两个经典任务:关系抽取和文本分类。在关系抽取任务中,我们尝试利用强化学习,解决远程监督方法自动生成的训练数据中的噪音问题。在文本分类任务中,我们利用强化学习得到更好的句子的结构化表示,并利用该表示得到了更好的文本分类效果。这两个工作均发表于AAAI 2018。


分享主题

强化学习在自然语言处理经典问题上的初探


分享提纲


1、强化学习基本概念简要介绍

2、基于强化学习的关系抽取方法,解决远程监督方法自动生成的训练数据中的噪音问题

3、基于强化学习的句子结构化表示学习方法



分享人简介

冯珺清华大学计算机系博士五年级,师从朱小燕和黄民烈教授,主要研究方向为知识图谱,强化学习。目前已在AAAI,COLING, WSDM等国际会议上发表多篇文章。


分享时间

北京时间2017年11月29日(周三) 20:00


参与方式

扫描海报二维码关注微信公众号,点击AI课程——公开课报名,入群交流




—————  AI 科技评论招人啦!  —————

我们诚招学术编辑 N 枚(全职,坐标北京)、新媒体运营 N 枚(全职,坐标深圳)。

详情请参见:招聘 | AI科技评论招人啦,学术编辑、新媒体运营虚位以待!

欢迎发送简历到 guoyixin@leiphone.com

—————  给爱学习的你的福利  —————

不要等到算法出现accuracy不好、loss很高、模型overfitting时,

才后悔没有掌握基础数学理论!

线性代数及矩阵论, 概率论与统计, 凸优化

AI慕课学院机器学习之数学基础课程即将上线!

扫码进入课程咨询群,组队享团购优惠!

详细了解点击文末阅读原文

————————————————————

登录查看更多
7

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【ICML2020-浙江大学】对抗性互信息的文本生成
专知会员服务
43+阅读 · 2020年7月4日
深度学习自然语言处理概述,216页ppt,Jindřich Helcl
专知会员服务
209+阅读 · 2020年4月26日
深度学习自然语言处理概述,116页ppt,Jiří Materna
专知会员服务
78+阅读 · 2020年3月10日
 第八届中国科技大学《计算机图形学》暑期课程课件
专知会员服务
54+阅读 · 2020年3月4日
【CCL 2019】ATT-第19期:生成对抗网络 (邱锡鹏)
专知会员服务
48+阅读 · 2019年11月12日
AAAI 2019 | 基于分层强化学习的关系抽取
PaperWeekly
20+阅读 · 2019年3月27日
公开课 | 强化学习及其在 NLP 上的应用
AI研习社
4+阅读 · 2018年6月14日
【回顾】深度学习在语音增强方向上的前沿研究
AI研习社
7+阅读 · 2017年11月20日
AliCoCo: Alibaba E-commerce Cognitive Concept Net
Arxiv
13+阅读 · 2020年3月30日
Arxiv
9+阅读 · 2020年2月15日
Arxiv
14+阅读 · 2020年1月27日
Arxiv
5+阅读 · 2018年4月22日
VIP会员
Top
微信扫码咨询专知VIP会员