本周值得读的15篇AI论文，还有源码搭配服用

会员服务 ·

本周值得读的15篇AI论文，还有源码搭配服用

2019 年 3 月 26 日 中国人工智能学会

在碎片化阅读充斥眼球的时代，越来越少的人会去关注每篇论文背后的探索和思考。

在这个栏目里，你会快速 get 每篇精选论文的亮点和痛点，时刻紧跟 AI 前沿成果。

点击本文底部的「阅读原文」即刻加入社区，查看更多最新论文推荐。

这是 PaperDaily 的第 131 篇文章

@jingyihiter 推荐

#Neural Sequence Generation

本文是自动化所张家俊老师发表于 TACL 2019 的工作，论文研究的问题是在序列生成任务的解码过程中如何进行双向解码。文章提出一种新的 beam search 算法用于双向解码，提出了改进 transformer 进行双向解码的 BIFT model，在机器翻译和文本摘要任务上都取得明显的提升。文中分别给出了详细的实验，并附有开源实现代码。

▲ 论文模型：点击查看大图

论文链接

https://www.paperweekly.site/papers/2867

源码链接

https://github.com/ZNLP/sb-nmt

@paperweekly 推荐

#Abstractive Summarization

本文来自 NAACL-HLT 2019，论文提出了一个名为多级存储网络（MMN）的生成式摘要模型，直接用多级卷积存储器代替基于 RNN 的编码器。该模型利用卷积来控制多级句子，段落和整个文本中的表示程度。

此外，本文还贡献了一个大型抽象摘要数据集—Reddit TIFU，包含来自 Reddit 的 120K 个帖子。基于 AMT 的定量评估和用户研究，本文模型在 Reddit TIFU 和新闻类生成式摘要数据集上均优于当前最先进的抽象概括方法。

▲ 论文模型：点击查看大图

论文链接

https://www.paperweekly.site/papers/2901

源码链接

https://github.com/ctr4si/MMN

@stevewyl 推荐

#Natural Language Understanding

本文来自微软，论文提出将多任务学习（MTL）和语言模型进行结合，提升了 NLU 领域的 GLUE 榜单 1.8%。本文是基于多任务学习框架和特征共享层硬连接的方式实现的，将原有 MT-DNN 模型中的特征表示层，替换为目前大热的 BERT。与 BERT 不同的是，微调是在多个任务上同时进行的。

本文是在 BERT 的基础上比较成功的一次探索，后续可以考虑任务之间的相关性。BERT 和 MTL 的结合可能是接下来的一个研究热点。不足之处是没有重大创新，MTL 的使用比较简单，有提升空间。

▲ 论文模型：点击查看大图

论文链接

https://www.paperweekly.site/papers/2809

源码链接

https://github.com/namisan/mt-dnn

@Hutommy 推荐

#Dialogue Systems

本文是波恩大学和波鸿鲁尔大学发表于 CoNLL 2018 的工作，论文基本说明了对话系统的类别，而且介绍了 RNN，BiRNN 以及 GRU 的思想。此外，本文结合了外部知识增加了一种机制，提高处理较低频的字词的能力。同时结合了领域关键字描述编码，在多回合对话中有所帮助。

▲ 论文模型：点击查看大图

论文链接

https://www.paperweekly.site/papers/2838

源码链接

https://github.com/SmartDataAnalytics/AK-DE-biGRU

@chunhualiu 推荐

#Story Ending Generation

本文是清华大学黄民烈老师组发表于 AAAI 2019 的工作，论文提供了一种如何利用常识知识做故事结尾生成的新思路。作者提出利用增量编码的方式来对 RocStories 数据集中的 context 进行编码，并且将从 ConceptNet 中检索得到的知识进行编码，利用 multi-source attention 的方式融合到 context 的编码过程中。

▲ 论文模型：点击查看大图

论文链接

https://www.paperweekly.site/papers/2775

源码链接

https://github.com/JianGuanTHU/StoryEndGen

@paperweekly 推荐

#Named Entity Recognition

本文是曼彻斯特大学和丰田工业大学发表于 NAACL 2018 的工作，论文提出了一种由 flat NER layers 动态连续堆叠而成的神经网络模型，每个 flat NER layer 含有一个 BiLSTM 和 CRF 分别进行输入编码和标签预测，整体模型为 Layered-BiLSTM-CRF。

当前 flat layer 将已被识别为实体的 token 经过 LSTM 处理的新表示合并起来，传递给下一个 flat layer，从而使得模型能以从内到外的方式，充分利用内部实体编码信息识别出外部实体，直到没有更外部的实体被识别出来。

▲ 论文模型：点击查看大图

论文链接

https://www.paperweekly.site/papers/2696

源码链接

https://github.com/meizhiju/layered-bilstm-crf

@xiaolu 推荐

#Visual Question Answering

本文是一篇来自港中文、清华大学等机构的最新 VQA 论文，被 CVPR 2019 接收为口头报告。Github 上已经有人复现了该工作。

学习多模态之间的高效特征融合是视觉问答问题的核心，本文提出了一种动态融合多模态特征的新方法，通过模态内（intra-modality ）和模态间（inter-modality）的信息流，交替地在视觉和语言模态之间传递动态信息。它可以稳健地捕获语言和视觉域之间的高层次语义交互，从而显著提高视觉问答的性能。

本文还发现，基于其它模态的约束，一种模态内的注意力可以动态调节目标模态的注意力。本文模型在 VQA2.0 数据集上实现了当前最好的效果。

▲ 论文模型：点击查看大图

论文链接

https://www.paperweekly.site/papers/2859

源码链接

https://github.com/bupt-cist/DFAF-for-VQA.pytorch

@vimjian 推荐

#6D Object Pose Estimation

本文是斯坦福和上海交大发表于 CVPR 2019 的工作，论文提出了一种可单独处理两个数据源的异质架构—DenseFusion。实验表明，DenseFusion 在 YCB-Video 和 LineMOD 两个数据集上的表现都优于当前最先进的方法。此外，研究者还将该方法应用于真实的机器人上，使其可以根据估计的姿态来抓取和操纵目标。

▲ 论文模型：点击查看大图

论文链接

https://www.paperweekly.site/papers/2862

源码链接

https://github.com/j96w/DenseFusion

@Flawless1202 推荐

#Object Detection

本文是中山大学和华为诺亚方舟实验室发表于 NeurIPS 2018 的工作，论文提出了大尺度目标检测的新思路，通过显性知识和隐性知识模块，将先验信息融合到神经网络中以丰富特征，取得了 SOTA 的效果。

▲ 论文模型：点击查看大图

论文链接

https://www.paperweekly.site/papers/2820

源码链接

https://github.com/chanyn/HKRM

@paperweekly 推荐

#Pose Transfer

本文来自特伦托大学和Snap，论文研究的问题是将视频中的物体动作迁移到一张图片上，然后基于这张图片和指定动作生成一个新视频。

作者通过一个深度框架够将外形和运动信息解耦，该框架由三个模块组成：1）关键点检测器，可以无监督训练提取对象关键点；2）深度运动预测网络，可从稀疏关键点生成密集的热图（heatmaps），从而更好地编码运动信息；3）运动迁移网络，该网络基于运动热图和从输入图像提取的外形信息去合成输出帧。

▲ 论文模型：点击查看大图

论文链接

https://www.paperweekly.site/papers/2836

源码链接

https://github.com/AliaksandrSiarohin/monkey-net

@BelieveOP5 推荐

#Image Generation

本文是 Google AI 发表于 PMLR 2018 的工作，论文将图像超分辨和 Self-Attention 机制结合起来，提出了一种将 Self-Attention 机制应用在图像生成领域上的新方法，值得一看。

▲ 论文模型：点击查看大图

论文链接

https://www.paperweekly.site/papers/2842

源码链接

https://github.com/tensorflow/tensor2tensor

@alichen 推荐

#Robotics

本文是普渡大学发表于 ICRA 2019 的工作。这篇文章提出了 Flapping Wing Micro Air Vehicles (FWMAVs) 开源仿真平台，并比较了仿真和实验测得的 force map，开环控制响应及闭环控制响应，发现仿真结果和实验结果非常相近。

和其他机器人仿真相比（例如 legged robots, ground vehicles），FWMAVs 仿真需要考虑在高频的 flapping motion 下，周围空气动力学的不稳定性，对系统进行建模难度更大。这个平台可用于机器人设计、控制与优化的研究，并与和 OpenAI Gym 环境完全兼容，利于今后强化学习和飞行控制相结合的研究。

▲ 论文模型：点击查看大图

论文链接

https://www.paperweekly.site/papers/2860

源码链接

https://github.com/purdue-biorobotics/flappy

@paperweekly 推荐

#Collaborative Filtering

本文是 Netflix、MIT 和 Google AI 发表于 WWW 2018 的工作，论文将变分自编码器（VAE）扩展到协同过滤以进行隐式反馈，通过非线性概率模型克服线性因子模型的局限。其次，作者引入了具有多项式似然（multinomial likelihood）的生成模型，并使用贝叶斯推断进行参数估计。

作者基于 VAE 提出了一个生成模型 VAE_CF，并针对 VAE 的正则参数和概率模型选取做了适当调整，使其在当前推荐任务中取得最佳结果。

▲ 论文模型：点击查看大图

论文链接

https://www.paperweekly.site/papers/2606

源码链接

https://github.com/dawenl/vae_cf

@zhangjun 推荐

#Bayesian Neural Network

本文是 UCLA 和 UC Davis 发表于 ICLR 2019 的工作，论文提出了一种新的对抗防御方法，结合了贝叶斯神经网络（BNN）和对抗训练的优势，获得了不错的效果。其中，BNN 将每个权重参数视作一个随机变量，在预测时相当于一个无限个数的集成模型，实验证明只依靠 BNN 并不能做好防御，结合对抗训练才会提升模型的防御能力。

点评：本文没有提出原创的方法，而是结合两种现有的方法进行了组合测试，取得了不错的效果。

▲ 论文模型：点击查看大图

论文链接

https://www.paperweekly.site/papers/2758

源码链接

https://github.com/xuanqing94/BayesianDefense

@RememberMe 推荐

#Financial Time Series

本文提出了一种确定股票价格时间序列中最佳 buy, sell, hold 时间点的股票交易模型，作者结合了两种已有方法 GA+DMLP (Genetic Algorithm and Deep Multi Layer Perceptron)。

具体思路：已有 1）技术分析指标（technical analysis indicator）作为深度网络模型的输入特征来做时间序列预测；2）用于技术分析指标寻优的进化算法。本文结合二者，将进化算法优化后的技术分析指标作为深度网络的输入特征，从而尝试使深度网络从进化算法的优化中学习判断最佳的进出点。

▲ 论文模型：点击查看大图

论文链接

https://www.paperweekly.site/papers/2889

源码链接

https://github.com/omerbsezer/SparkDeepMlpGADow30

@chlr1995 推荐

#Network Pruning

本文是图森发表在 ECCV 2018 的工作，论文在结构稀疏化的基础上提出了一种更简洁的方式，达到粗粒度的剪枝（直接剪枝整个 residual function/aggregated residual block 中的一个 group），通过引入一个结构缩放因子 lambda，在训练过程中对 lambda 施加一个 L1 正则化，训练结束后，剪掉 lambda=0 的块或 group，达成网络剪枝的效果。

▲ 论文模型：点击查看大图

论文链接

https://www.paperweekly.site/papers/2540

源码链接

https://github.com/huangzehao/sparse-structure-selection

#推荐有礼#

本期所有入选论文的推荐人

均将获得PaperWeekly纪念周边一份

▲ 深度学习主题行李牌/卡套 + 防水贴纸

礼物领取方式

推荐人请根据论文详情页底部留言

添加小助手领取礼物

*每位用户仅限领取一次

想要赢取以上周边好礼？

点击阅读原文即刻推荐论文吧！

点击以下标题查看往期推荐：

#投稿通道#

让你的论文被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体，缩短读者寻找优质内容的成本呢？ 答案就是：你不认识的人。

总有一些你不认识的人，知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁，促使不同背景、不同方向的学者和学术灵感相互碰撞，迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人，在我们的平台上分享各类优质内容，可以是最新论文解读，也可以是学习心得或技术干货。我们的目的只有一个，让知识真正流动起来。

📝 来稿标准：

• 稿件确系个人原创作品，来稿需注明作者个人信息（姓名+学校/工作单位+学历/职位+研究方向）

• 如果文章并非首发，请在投稿时提醒并附上所有已发布链接

• PaperWeekly 默认每篇文章都是首发，均会添加“原创”标志

📬 投稿邮箱：

• 投稿邮箱：hr@paperweekly.site

• 所有文章配图，请单独在附件中发送

• 请留下即时联系方式（微信或手机），以便我们在编辑发布时和作者沟通

🔍

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 获取更多论文推荐

登录查看更多

相关内容

多任务学习

关注 154

多任务学习（MTL）是机器学习的一个子领域，可以同时解决多个学习任务，同时利用各个任务之间的共性和差异。与单独训练模型相比，这可以提高特定任务模型的学习效率和预测准确性。多任务学习是归纳传递的一种方法，它通过将相关任务的训练信号中包含的域信息用作归纳偏差来提高泛化能力。通过使用共享表示形式并行学习任务来实现,每个任务所学的知识可以帮助更好地学习其它任务。

【ACL20-哈工大】基于图注意力网络的多粒度机器阅读理解文档建模

专知会员服务

41+阅读 · 2020年7月1日

【ICML2020-西电】用于语言生成的递归层次主题引导RNN

专知会员服务

21+阅读 · 2020年6月30日

基于深度学习的多标签生成研究进展

专知会员服务

140+阅读 · 2020年4月25日

17篇知识图谱Knowledge Graphs论文 @AAAI2020

专知会员服务

167+阅读 · 2020年2月13日