直播 | 明晚八点！清华AAAI录用论文——强化学习在自然语言处理经典问题上的初探 - 专知

会员服务 ·

0

直播 | 明晚八点！清华AAAI录用论文——强化学习在自然语言处理经典问题上的初探

2017 年 11 月 28 日 AI科技评论 连接学术产业的

分享背景

▼

随着强化学习在机器人和游戏AI等领域的成功，该方法也引起了越来越多的关注。本次分享将介绍我们利用强化学习技术，更好地解决自然语言处理中的两个经典任务：关系抽取和文本分类。在关系抽取任务中，我们尝试利用强化学习，解决远程监督方法自动生成的训练数据中的噪音问题。在文本分类任务中，我们利用强化学习得到更好的句子的结构化表示，并利用该表示得到了更好的文本分类效果。这两个工作均发表于AAAI 2018。

分享主题

▼

强化学习在自然语言处理经典问题上的初探

分享提纲

▼

1、强化学习基本概念简要介绍

2、基于强化学习的关系抽取方法，解决远程监督方法自动生成的训练数据中的噪音问题

3、基于强化学习的句子结构化表示学习方法

分享人简介

▼

冯珺，清华大学计算机系博士五年级，师从朱小燕和黄民烈教授，主要研究方向为知识图谱，强化学习。目前已在AAAI，COLING, WSDM等国际会议上发表多篇文章。

分享时间

▼

北京时间2017年11月29日（周三） 20:00

参与方式

▼

扫描海报二维码关注微信公众号，点击AI课程——公开课报名，入群交流

————— AI 科技评论招人啦！ —————

我们诚招学术编辑 N 枚（全职，坐标北京）、新媒体运营 N 枚（全职，坐标深圳）。

详情请参见：招聘 | AI科技评论招人啦，学术编辑、新媒体运营虚位以待！

欢迎发送简历到 guoyixin@leiphone.com

————— 给爱学习的你的福利 —————

不要等到算法出现accuracy不好、loss很高、模型overfitting时，

才后悔没有掌握基础数学理论！

线性代数及矩阵论，概率论与统计，凸优化

AI慕课学院机器学习之数学基础课程即将上线！

扫码进入课程咨询群，组队享团购优惠！

详细了解点击文末阅读原文

————————————————————

登录查看更多

7

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【ICML2020-浙江大学】对抗性互信息的文本生成

【ICML2020-浙江大学】对抗性互信息的文本生成

专知会员服务

44+阅读 · 2020年7月4日

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

专知会员服务

216+阅读 · 2020年4月26日

深度学习自然语言处理概述，116页ppt，Jiří Materna

深度学习自然语言处理概述，116页ppt，Jiří Materna

专知会员服务

81+阅读 · 2020年3月10日

第八届中国科技大学《计算机图形学》暑期课程课件

第八届中国科技大学《计算机图形学》暑期课程课件

专知会员服务

60+阅读 · 2020年3月4日

【EMNLP2019教程】图神经网络GNN的自然语言处理，附315页PPT及作者博士论文下载

【EMNLP2019教程】图神经网络GNN的自然语言处理，附315页PPT及作者博士论文下载

专知会员服务

77+阅读 · 2020年1月27日

慕尼黑大学LMU博士论文：自然语言文本神经网络信息提取，240页pdf

慕尼黑大学LMU博士论文：自然语言文本神经网络信息提取，240页pdf

专知会员服务

74+阅读 · 2020年1月13日

【CCL 2019】句法分析前沿动态综述，上海科技大学屠可伟博士

【CCL 2019】句法分析前沿动态综述，上海科技大学屠可伟博士

专知会员服务

26+阅读 · 2019年11月12日

【CCL 2019】ATT-第19期：生成对抗网络（邱锡鹏）

【CCL 2019】ATT-第19期：生成对抗网络（邱锡鹏）

专知会员服务

50+阅读 · 2019年11月12日

机器学习经典—理论与算法 [王立威北京大学] 2019年中国计算机大会计算机经典算法回顾与展望——机器学习与数据挖掘论坛

机器学习经典—理论与算法 [王立威北京大学] 2019年中国计算机大会计算机经典算法回顾与展望——机器学习与数据挖掘论坛

专知会员服务

36+阅读 · 2019年10月26日

社交机器人的挑战性问题，清华大学计算机系黄民烈副教授，SMP 2019 前沿技术讲习班第十五期（CIPS ATT 15）

社交机器人的挑战性问题，清华大学计算机系黄民烈副教授，SMP 2019 前沿技术讲习班第十五期（CIPS ATT 15）

专知会员服务

21+阅读 · 2019年10月23日

AAAI 2019 | 基于分层强化学习的关系抽取

AAAI 2019 | 基于分层强化学习的关系抽取

PaperWeekly

20+阅读 · 2019年3月27日

公开课 | 强化学习及其在 NLP 上的应用

公开课 | 强化学习及其在 NLP 上的应用

AI研习社

4+阅读 · 2018年6月14日

干货 | AAAI 2018 论文预讲：当强化学习遇见自然语言处理有哪些奇妙的化学反应？

干货 | AAAI 2018 论文预讲：当强化学习遇见自然语言处理有哪些奇妙的化学反应？

AI科技评论

7+阅读 · 2018年1月10日

直播 | 明晚八点！听浙大博士生刘汉唐介绍图像分割的经典算法

直播 | 明晚八点！听浙大博士生刘汉唐介绍图像分割的经典算法

AI科技评论

8+阅读 · 2018年1月8日

直播 | 今晚八点！听清华博士孙奕帆介绍行人再识别论文及最新相关进展

直播 | 今晚八点！听清华博士孙奕帆介绍行人再识别论文及最新相关进展

AI科技评论

4+阅读 · 2017年12月21日

今晚直播 | 基于生成模型的事件流研究 + NIPS 2017 论文解读

今晚直播 | 基于生成模型的事件流研究 + NIPS 2017 论文解读

PaperWeekly

5+阅读 · 2017年12月20日

直播 | 明晚八点！中科院博士讲解基于网络化数据表示学习的重叠社区发现研究

直播 | 明晚八点！中科院博士讲解基于网络化数据表示学习的重叠社区发现研究

AI科技评论

4+阅读 · 2017年12月6日

清华大学冯珺：基于强化学习的关系抽取和文本分类 | 实录·PhD Talk

清华大学冯珺：基于强化学习的关系抽取和文本分类 | 实录·PhD Talk

PaperWeekly

11+阅读 · 2017年11月23日

今晚8点：基于强化学习的关系抽取和文本分类 | PhD Talk #18

今晚8点：基于强化学习的关系抽取和文本分类 | PhD Talk #18

PaperWeekly

4+阅读 · 2017年11月22日

【回顾】深度学习在语音增强方向上的前沿研究

【回顾】深度学习在语音增强方向上的前沿研究

AI研习社

7+阅读 · 2017年11月20日

AliCoCo: Alibaba E-commerce Cognitive Concept Net

AliCoCo: Alibaba E-commerce Cognitive Concept Net

Arxiv

13+阅读 · 2020年3月30日

What Can Neural Networks Reason About?

Arxiv

10+阅读 · 2020年2月15日

Towards a Human-like Open-Domain Chatbot

Arxiv

14+阅读 · 2020年1月27日

AliMe KBQA: Question Answering over Structured Knowledge for E-commerce Customer Service

AliMe KBQA: Question Answering over Structured Knowledge for E-commerce Customer Service

Arxiv

23+阅读 · 2019年12月12日

Zero-Shot Entity Linking by Reading Entity Descriptions

Zero-Shot Entity Linking by Reading Entity Descriptions

Arxiv

6+阅读 · 2019年6月18日

PPO-CMA: Proximal Policy Optimization with Covariance Matrix Adaptation

PPO-CMA: Proximal Policy Optimization with Covariance Matrix Adaptation

Arxiv

8+阅读 · 2018年12月18日

Fast deep reinforcement learning using online adjustments from the past

Arxiv

3+阅读 · 2018年10月18日

A Gauss-Newton Approach to Real-Time Monocular Multiple Object Tracking

A Gauss-Newton Approach to Real-Time Monocular Multiple Object Tracking

Arxiv

4+阅读 · 2018年7月5日

Logically-Constrained Reinforcement Learning

Arxiv

5+阅读 · 2018年4月22日

Experience-driven Networking: A Deep Reinforcement Learning based Approach

Arxiv

9+阅读 · 2018年1月17日

VIP会员

相关主题

自然语言处理

相关VIP内容

【ICML2020-浙江大学】对抗性互信息的文本生成

【ICML2020-浙江大学】对抗性互信息的文本生成

专知会员服务

44+阅读 · 2020年7月4日

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

专知会员服务

216+阅读 · 2020年4月26日

深度学习自然语言处理概述，116页ppt，Jiří Materna

深度学习自然语言处理概述，116页ppt，Jiří Materna

专知会员服务

81+阅读 · 2020年3月10日

第八届中国科技大学《计算机图形学》暑期课程课件

第八届中国科技大学《计算机图形学》暑期课程课件

专知会员服务

60+阅读 · 2020年3月4日

【EMNLP2019教程】图神经网络GNN的自然语言处理，附315页PPT及作者博士论文下载

【EMNLP2019教程】图神经网络GNN的自然语言处理，附315页PPT及作者博士论文下载

专知会员服务

77+阅读 · 2020年1月27日

慕尼黑大学LMU博士论文：自然语言文本神经网络信息提取，240页pdf

慕尼黑大学LMU博士论文：自然语言文本神经网络信息提取，240页pdf

专知会员服务

74+阅读 · 2020年1月13日

【CCL 2019】句法分析前沿动态综述，上海科技大学屠可伟博士

【CCL 2019】句法分析前沿动态综述，上海科技大学屠可伟博士

专知会员服务

26+阅读 · 2019年11月12日

【CCL 2019】ATT-第19期：生成对抗网络（邱锡鹏）

【CCL 2019】ATT-第19期：生成对抗网络（邱锡鹏）

专知会员服务

50+阅读 · 2019年11月12日

机器学习经典—理论与算法 [王立威北京大学] 2019年中国计算机大会计算机经典算法回顾与展望——机器学习与数据挖掘论坛

机器学习经典—理论与算法 [王立威北京大学] 2019年中国计算机大会计算机经典算法回顾与展望——机器学习与数据挖掘论坛

专知会员服务

36+阅读 · 2019年10月26日

社交机器人的挑战性问题，清华大学计算机系黄民烈副教授，SMP 2019 前沿技术讲习班第十五期（CIPS ATT 15）

社交机器人的挑战性问题，清华大学计算机系黄民烈副教授，SMP 2019 前沿技术讲习班第十五期（CIPS ATT 15）

专知会员服务

21+阅读 · 2019年10月23日

热门VIP内容

开通专知VIP会员享更多权益服务

【ICML2025】用于持续多模态指令微调的动态课程化LoRA专家混合机制

生成模型中持续学习的综合综述

【斯坦福博士论文】通过以人为本的自然语言界面拓展 AI 的可及性

【新书】《LangChain生成式AI实战：使用 Python 与 LangGraph 构建大语言模型应用与高级智能体》

相关资讯

AAAI 2019 | 基于分层强化学习的关系抽取

AAAI 2019 | 基于分层强化学习的关系抽取

PaperWeekly

20+阅读 · 2019年3月27日

公开课 | 强化学习及其在 NLP 上的应用

公开课 | 强化学习及其在 NLP 上的应用

AI研习社

4+阅读 · 2018年6月14日

干货 | AAAI 2018 论文预讲：当强化学习遇见自然语言处理有哪些奇妙的化学反应？

干货 | AAAI 2018 论文预讲：当强化学习遇见自然语言处理有哪些奇妙的化学反应？

AI科技评论

7+阅读 · 2018年1月10日

直播 | 明晚八点！听浙大博士生刘汉唐介绍图像分割的经典算法

直播 | 明晚八点！听浙大博士生刘汉唐介绍图像分割的经典算法

AI科技评论

8+阅读 · 2018年1月8日

直播 | 今晚八点！听清华博士孙奕帆介绍行人再识别论文及最新相关进展

直播 | 今晚八点！听清华博士孙奕帆介绍行人再识别论文及最新相关进展

AI科技评论

4+阅读 · 2017年12月21日

今晚直播 | 基于生成模型的事件流研究 + NIPS 2017 论文解读

今晚直播 | 基于生成模型的事件流研究 + NIPS 2017 论文解读

PaperWeekly

5+阅读 · 2017年12月20日

直播 | 明晚八点！中科院博士讲解基于网络化数据表示学习的重叠社区发现研究

直播 | 明晚八点！中科院博士讲解基于网络化数据表示学习的重叠社区发现研究

AI科技评论

4+阅读 · 2017年12月6日

清华大学冯珺：基于强化学习的关系抽取和文本分类 | 实录·PhD Talk

清华大学冯珺：基于强化学习的关系抽取和文本分类 | 实录·PhD Talk

PaperWeekly

11+阅读 · 2017年11月23日

今晚8点：基于强化学习的关系抽取和文本分类 | PhD Talk #18

今晚8点：基于强化学习的关系抽取和文本分类 | PhD Talk #18

PaperWeekly

4+阅读 · 2017年11月22日

【回顾】深度学习在语音增强方向上的前沿研究

【回顾】深度学习在语音增强方向上的前沿研究

AI研习社

7+阅读 · 2017年11月20日

相关论文

AliCoCo: Alibaba E-commerce Cognitive Concept Net

AliCoCo: Alibaba E-commerce Cognitive Concept Net

Arxiv

13+阅读 · 2020年3月30日

What Can Neural Networks Reason About?

Arxiv

10+阅读 · 2020年2月15日

Towards a Human-like Open-Domain Chatbot

Arxiv

14+阅读 · 2020年1月27日

AliMe KBQA: Question Answering over Structured Knowledge for E-commerce Customer Service

AliMe KBQA: Question Answering over Structured Knowledge for E-commerce Customer Service

Arxiv

23+阅读 · 2019年12月12日

Zero-Shot Entity Linking by Reading Entity Descriptions

Zero-Shot Entity Linking by Reading Entity Descriptions

Arxiv

6+阅读 · 2019年6月18日

PPO-CMA: Proximal Policy Optimization with Covariance Matrix Adaptation

PPO-CMA: Proximal Policy Optimization with Covariance Matrix Adaptation

Arxiv

8+阅读 · 2018年12月18日

Fast deep reinforcement learning using online adjustments from the past

Arxiv

3+阅读 · 2018年10月18日

A Gauss-Newton Approach to Real-Time Monocular Multiple Object Tracking

A Gauss-Newton Approach to Real-Time Monocular Multiple Object Tracking

Arxiv

4+阅读 · 2018年7月5日

Logically-Constrained Reinforcement Learning

Arxiv

5+阅读 · 2018年4月22日

Experience-driven Networking: A Deep Reinforcement Learning based Approach

Arxiv

9+阅读 · 2018年1月17日

大家都在搜

大型语言模型

CMU博士论文

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员