会员服务 ·

0

每日论文 | 无注意力翻译模型；可微分的模型预测控制；解决复杂图形中的最短距离问题

2018 年 11 月 2 日 论智

1

You May Not Need Attention

在神经机器翻译中，如果没有注意力并且将编码解码分离，我们能得到怎样的结果？为了回答这一问题，我们提出了一种循环神经翻译模型，不用注意力，也没有分离的编码器和解码器。这种模型延迟率低，在读取第一个源token时，就会立刻写出目标token，并且在解码时可以使用即时记忆。翻译性能与Bahdanau等人的注意力模型相当。

地址：https://arxiv.org/abs/1810.13409

2

Differentiable MPC for End-to-end Planning and Control

在这篇论文中，我们提出用模型预测控制（MPC）作为一种连续状态和动作空间中强化学习的可微分策略类别。这就提供了一种方法，可以使用和结合有模型和无模型两种方法。由此，我们可以通过端到端学习了解控制器的成本和动态。

地址：https://arxiv.org/abs/1810.13400

3

Effect of shortest path multiplicity on congestion of multiplex networks

最短距离是图形中具有代表性的距离测量问题，在很多网络中都有出现。在复杂网络中，这种距离计算对图层的计算是很重要的，在堵车情况发生时，解决了最短距离可以有效提高交通效率。在这篇文章中，我们提出了一种数学方法，用来计算距离的共同分布，以及复杂网络中最短距离的多样性，研究它们在堵车过程中的关系。

地址：https://arxiv.org/abs/1810.12961

星标论智，每天获取最新资讯

登录查看更多

3

相关内容

模型预测控制

模型预测控制

模型预测控制是一类特殊的控制。它的当前控制动作是在每一个采样瞬间通过求解一个有限时域开环最优控制问题而获得。过程的当前状态作为最优控制问题的初始状态，解得的最优控制序列只实施第一个控制作用。这是它与那些使用预先计算控制律的算法的最大不同。本质上模型预测控制求解一个开环最优控制问题。它的思想与具体的模型无关，但是实现则与模型有关。

【NeurIPS2020提交论文】通用表示Transformer层的小样本图像分类

【NeurIPS2020提交论文】通用表示Transformer层的小样本图像分类

专知会员服务

59+阅读 · 2020年6月29日

【NeurIPS2020提交论文】建立具有消息传递的等变图神经网络

【NeurIPS2020提交论文】建立具有消息传递的等变图神经网络

专知会员服务

50+阅读 · 2020年6月29日

【NeurIPS 2019】多关系庞加莱图嵌入，Multi-relational Poincaré Graph Embeddings

【NeurIPS 2019】多关系庞加莱图嵌入，Multi-relational Poincaré Graph Embeddings

专知会员服务

49+阅读 · 2020年6月15日

【CMU】深度学习模型中集成优化、约束和控制，33页ppt

【CMU】深度学习模型中集成优化、约束和控制，33页ppt

专知会员服务

46+阅读 · 2020年5月23日

【伯克利】通过增大模型加速Transformer训练和推理

专知会员服务

45+阅读 · 2020年3月6日

Transformer文本分类代码

Transformer文本分类代码

专知会员服务

118+阅读 · 2020年2月3日

【UCLA论文】利用神经网络进行时间序列预测的综合分析，Comprehensive Analysis of Time Series Forecasting Using Neural Networks

【UCLA论文】利用神经网络进行时间序列预测的综合分析，Comprehensive Analysis of Time Series Forecasting Using Neural Networks

专知会员服务

97+阅读 · 2020年2月3日

【AI应用】Facebook-利用神经网络求解高等数学方程, Using neural networks to solve advanced mathematics equations

【AI应用】Facebook-利用神经网络求解高等数学方程, Using neural networks to solve advanced mathematics equations

专知会员服务

34+阅读 · 2020年1月15日

【ICLR2020论文】自我注意力与卷积层的关系，On the Relationship between Self-Attention and Convolutional Layers

【ICLR2020论文】自我注意力与卷积层的关系，On the Relationship between Self-Attention and Convolutional Layers

专知会员服务

37+阅读 · 2020年1月12日

【AAAI2020论文】多轮对话系统中的历史自适应知识融合机制, 中科院信工所孙雅静等

专知会员服务

60+阅读 · 2019年11月23日

CMU、谷歌提出Transformer-XL：学习超长上下文关系

CMU、谷歌提出Transformer-XL：学习超长上下文关系

机器之心

9+阅读 · 2019年1月18日

SNN，像你的大脑一样工作

SNN，像你的大脑一样工作

中国科学院自动化研究所

80+阅读 · 2018年11月7日

每日论文 | 用于紧凑语义分割模型的框架搜索；用深度学习进行命名实体消歧；多特征文本风格迁移

每日论文 | 用于紧凑语义分割模型的框架搜索；用深度学习进行命名实体消歧；多特征文本风格迁移

论智

11+阅读 · 2018年11月5日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

每日论文 | 用卷积网络恢复模糊图像；面向语义分割的域适应；动态图形神经网络

每日论文 | 用卷积网络恢复模糊图像；面向语义分割的域适应；动态图形神经网络

论智

4+阅读 · 2018年10月29日

每日论文 | 反向强化学习在电子游戏中的应用；用数学理论解释语义现象；在4k和8k视频上进行目标检测

每日论文 | 反向强化学习在电子游戏中的应用；用数学理论解释语义现象；在4k和8k视频上进行目标检测

论智

3+阅读 · 2018年10月27日

每日论文 | 解决密集几何对齐问题的网络DGC-Net；钢琴乐谱数据集POD；通过类别分层实现零次学习迁移

每日论文 | 解决密集几何对齐问题的网络DGC-Net；钢琴乐谱数据集POD；通过类别分层实现零次学习迁移

论智

8+阅读 · 2018年10月23日

每日论文 | 谷歌新模型BERT刷新多项NLP任务成绩；三大概率模型详解；另辟蹊径解决多任务学习

每日论文 | 谷歌新模型BERT刷新多项NLP任务成绩；三大概率模型详解；另辟蹊径解决多任务学习

论智

6+阅读 · 2018年10月12日

深度学习中的注意力机制

深度学习中的注意力机制

CSDN大数据

24+阅读 · 2017年11月2日

神经网络中的「注意力」是什么？怎么用？

神经网络中的「注意力」是什么？怎么用？

北京思腾合力科技有限公司

17+阅读 · 2017年10月28日

Jointly Modeling Aspect and Sentiment with Dynamic Heterogeneous Graph Neural Networks

Jointly Modeling Aspect and Sentiment with Dynamic Heterogeneous Graph Neural Networks

Arxiv

8+阅读 · 2020年4月14日

Geometric Graph Convolutional Neural Networks

Geometric Graph Convolutional Neural Networks

Arxiv

10+阅读 · 2019年9月11日

Do Transformer Attention Heads Provide Transparency in Abstractive Summarization?

Do Transformer Attention Heads Provide Transparency in Abstractive Summarization?

Arxiv

3+阅读 · 2019年7月8日

An Attentive Survey of Attention Models

Arxiv

19+阅读 · 2019年4月5日

Improved Deep Embeddings for Inferencing with Multi-Layered Networks

Improved Deep Embeddings for Inferencing with Multi-Layered Networks

Arxiv

3+阅读 · 2019年3月1日

A Probe into Understanding GAN and VAE models

A Probe into Understanding GAN and VAE models

Arxiv

9+阅读 · 2018年12月13日

Learning to Importance Sample in Primary Sample Space

Learning to Importance Sample in Primary Sample Space

Arxiv

5+阅读 · 2018年8月23日

ALMN: Deep Embedding Learning with Geometrical Virtual Point Generating

Arxiv

5+阅读 · 2018年6月5日

Improving Neural Machine Translation with Conditional Sequence Generative Adversarial Nets

Arxiv

3+阅读 · 2018年4月8日

AffordanceNet: An End-to-End Deep Learning Approach for Object Affordance Detection

Arxiv

3+阅读 · 2018年3月4日

VIP会员

相关主题

模型预测控制

神经机器翻译

词元分析器

相关VIP内容

【NeurIPS2020提交论文】通用表示Transformer层的小样本图像分类

【NeurIPS2020提交论文】通用表示Transformer层的小样本图像分类

专知会员服务

59+阅读 · 2020年6月29日

【NeurIPS2020提交论文】建立具有消息传递的等变图神经网络

【NeurIPS2020提交论文】建立具有消息传递的等变图神经网络

专知会员服务

50+阅读 · 2020年6月29日

【NeurIPS 2019】多关系庞加莱图嵌入，Multi-relational Poincaré Graph Embeddings

【NeurIPS 2019】多关系庞加莱图嵌入，Multi-relational Poincaré Graph Embeddings

专知会员服务

49+阅读 · 2020年6月15日

【CMU】深度学习模型中集成优化、约束和控制，33页ppt

【CMU】深度学习模型中集成优化、约束和控制，33页ppt

专知会员服务

46+阅读 · 2020年5月23日

【伯克利】通过增大模型加速Transformer训练和推理

专知会员服务

45+阅读 · 2020年3月6日

Transformer文本分类代码

Transformer文本分类代码

专知会员服务

118+阅读 · 2020年2月3日

【UCLA论文】利用神经网络进行时间序列预测的综合分析，Comprehensive Analysis of Time Series Forecasting Using Neural Networks

【UCLA论文】利用神经网络进行时间序列预测的综合分析，Comprehensive Analysis of Time Series Forecasting Using Neural Networks

专知会员服务

97+阅读 · 2020年2月3日

【AI应用】Facebook-利用神经网络求解高等数学方程, Using neural networks to solve advanced mathematics equations

【AI应用】Facebook-利用神经网络求解高等数学方程, Using neural networks to solve advanced mathematics equations

专知会员服务

34+阅读 · 2020年1月15日

【ICLR2020论文】自我注意力与卷积层的关系，On the Relationship between Self-Attention and Convolutional Layers

【ICLR2020论文】自我注意力与卷积层的关系，On the Relationship between Self-Attention and Convolutional Layers

专知会员服务

37+阅读 · 2020年1月12日

【AAAI2020论文】多轮对话系统中的历史自适应知识融合机制, 中科院信工所孙雅静等

专知会员服务

60+阅读 · 2019年11月23日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌战争凸显巡飞弹药新角色

《基于随机优化提升军事医疗后送系统效能》最新165页博士论文

《指挥控制能力发展：现状与未来》英国防部2025最新62页报告

《智能弹药与第一人称视角无人机之对比分析》最新报告

相关资讯

CMU、谷歌提出Transformer-XL：学习超长上下文关系

CMU、谷歌提出Transformer-XL：学习超长上下文关系

机器之心

9+阅读 · 2019年1月18日

SNN，像你的大脑一样工作

SNN，像你的大脑一样工作

中国科学院自动化研究所

80+阅读 · 2018年11月7日

每日论文 | 用于紧凑语义分割模型的框架搜索；用深度学习进行命名实体消歧；多特征文本风格迁移

每日论文 | 用于紧凑语义分割模型的框架搜索；用深度学习进行命名实体消歧；多特征文本风格迁移

论智

11+阅读 · 2018年11月5日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

每日论文 | 用卷积网络恢复模糊图像；面向语义分割的域适应；动态图形神经网络

每日论文 | 用卷积网络恢复模糊图像；面向语义分割的域适应；动态图形神经网络

论智

4+阅读 · 2018年10月29日

每日论文 | 反向强化学习在电子游戏中的应用；用数学理论解释语义现象；在4k和8k视频上进行目标检测

每日论文 | 反向强化学习在电子游戏中的应用；用数学理论解释语义现象；在4k和8k视频上进行目标检测

论智

3+阅读 · 2018年10月27日

每日论文 | 解决密集几何对齐问题的网络DGC-Net；钢琴乐谱数据集POD；通过类别分层实现零次学习迁移

每日论文 | 解决密集几何对齐问题的网络DGC-Net；钢琴乐谱数据集POD；通过类别分层实现零次学习迁移

论智

8+阅读 · 2018年10月23日

每日论文 | 谷歌新模型BERT刷新多项NLP任务成绩；三大概率模型详解；另辟蹊径解决多任务学习

每日论文 | 谷歌新模型BERT刷新多项NLP任务成绩；三大概率模型详解；另辟蹊径解决多任务学习

论智

6+阅读 · 2018年10月12日

深度学习中的注意力机制

深度学习中的注意力机制

CSDN大数据

24+阅读 · 2017年11月2日

神经网络中的「注意力」是什么？怎么用？

神经网络中的「注意力」是什么？怎么用？

北京思腾合力科技有限公司

17+阅读 · 2017年10月28日

相关论文

Jointly Modeling Aspect and Sentiment with Dynamic Heterogeneous Graph Neural Networks

Jointly Modeling Aspect and Sentiment with Dynamic Heterogeneous Graph Neural Networks

Arxiv

8+阅读 · 2020年4月14日

Geometric Graph Convolutional Neural Networks

Geometric Graph Convolutional Neural Networks

Arxiv

10+阅读 · 2019年9月11日

Do Transformer Attention Heads Provide Transparency in Abstractive Summarization?

Do Transformer Attention Heads Provide Transparency in Abstractive Summarization?

Arxiv

3+阅读 · 2019年7月8日

An Attentive Survey of Attention Models

Arxiv

19+阅读 · 2019年4月5日

Improved Deep Embeddings for Inferencing with Multi-Layered Networks

Improved Deep Embeddings for Inferencing with Multi-Layered Networks

Arxiv

3+阅读 · 2019年3月1日

A Probe into Understanding GAN and VAE models

A Probe into Understanding GAN and VAE models

Arxiv

9+阅读 · 2018年12月13日

Learning to Importance Sample in Primary Sample Space

Learning to Importance Sample in Primary Sample Space

Arxiv

5+阅读 · 2018年8月23日

ALMN: Deep Embedding Learning with Geometrical Virtual Point Generating

Arxiv

5+阅读 · 2018年6月5日

Improving Neural Machine Translation with Conditional Sequence Generative Adversarial Nets

Arxiv

3+阅读 · 2018年4月8日

AffordanceNet: An End-to-End Deep Learning Approach for Object Affordance Detection

Arxiv

3+阅读 · 2018年3月4日

大家都在搜

大型语言模型

IJCAI2025教程

久别重逢话双塔

国防科技创新

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员