今日 Paper | 3D手势估计；自学习机器人；鲁棒语义分割；卷积神经网络；混合高斯过程等

会员服务 ·

今日 Paper | 3D手势估计；自学习机器人；鲁棒语义分割；卷积神经网络；混合高斯过程等

2020 年 1 月 8 日 AI科技评论

为了帮助各位学术青年更好地学习前沿研究成果和技术，AI科技评论联合Paper 研习社（paper.yanxishe.com），重磅推出【今日 Paper】栏目，每天都为你精选关于人工智能的前沿学术论文供你学习参考。以下是今日的精选内容——

Self learning robot using real-time neural networks
Robust Semantic Segmentation of Brain Tumor Regions from 3D MRIs
Inferring Convolutional Neural Networks' accuracies from their architectural characterizations
Hierarchical Reinforcement Learning as a Model of Human Task Interleaving
A Hybrid Gaussian Process Approach to Robust Economic Model Predictive Control
Attributed Multi-Relational Attention Network for Fact-checking URL Recommendation
Data Structure Primitives on Persistent Memory: An Evaluation
HandAugment: A Simple Data Augmentation for HANDS19 Challenge Task 1 -- Depth-Based 3D Hand Pose Estimation
From 'F' to 'A' on the N.Y. Regents Science Exams: An Overview of the Aristo Project
Information Theoretic Model Predictive Q-Learning

使用实时神经网络的自学习机器人

论文名称：Self learning robot using real-time neural networks

作者：Gupta Chirag /Nangia Chikita /Kumar Chetan

发表时间：2020/1/6

论文链接：https://paper.yanxishe.com/review/8314

推荐理由：随着高容量，低精度计算技术的发展以及认知人工智能启发式系统的应用研究，通过具有实时学习功能的神经网络的机器学习解决方案引起了研究界以及整个行业的极大兴趣。

本文涉及对神经网络的研究，开发和实验分析，该神经网络在带有手臂的机器人上实现，通过该机器人的进化可以学习直线或根据需要行走。神经网络使用梯度下降和反向传播算法进行学习。神经网络的实现和训练均在树莓派pi 3上的机器人上本地完成，因此其学习过程是完全独立的。首先在MATLAB上开发的自定义模拟器上对神经网络进行测试，然后在树莓派计算机上对其进行实现。存储每一代不断发展的网络中的数据，并对数据进行数学和图形分析。分析了学习率和容错度等因素对学习过程和最终输出的影响。

从3D MRI进行脑肿瘤区域的鲁棒语义分割

论文名称：Robust Semantic Segmentation of Brain Tumor Regions from 3D MRIs

作者：Myronenko Andriy /Hatamizadeh Ali

发表时间：2020/1/6

论文链接：https://paper.yanxishe.com/review/8316

推荐理由：多模式脑肿瘤分割挑战（BraTS）将研究人员召集起来，以改进3D MRI脑肿瘤分割的自动化方法。肿瘤分割是疾病诊断和治疗计划所必需的基本视觉任务之一。得益于现代GPU的出现，前几年获胜的方法都是基于深度学习的，可以快速优化深度卷积神经网络体系结构。

在这项工作中，作者探索了3D语义分割的最佳实践，包括常规的编码器-解码器体系结构以及组合的损失函数，以试图进一步提高分割的准确性。作者评估了BraTS 2019挑战赛的方法。

从卷积神经网络的架构特征推断出其准确性

论文名称：Inferring Convolutional Neural Networks' accuracies from their architectural characterizations

作者：Hoang D. /Hamer J. /Perdue G. N. /Young S. R. /Miller J. /Ghosh A.

发表时间：2020/1/7

论文链接：https://paper.yanxishe.com/review/8311

推荐理由：卷积神经网络（CNN）在分析来自许多领域（包括粒子成像探测器）的科学数据方面显示出了巨大的希望。但是，对于特定的应用程序和不同的数据集选择合适的网络体系结构（深度，内核形状，激活功能等）的挑战仍然知之甚少。

在本文中，作者通过提出一种系统的语言来研究CNN的体系结构与其性能之间的关系，该语言对于训练之前的不同CNN的体系结构之间的比较很有用。通过不同的属性来表征CNN的体系结构，并证明这些属性可以预测两个特定的基于计算机视觉的物理问题中的网络性能-事件顶点发现和费米国家加速器实验室的MINERvA实验中的强子多重性分类。为此，作者从针对物理问题的优化网络架构中提取了几种架构属性，这些属性是一种称为多节点深度学习神经网络的模型选择算法（MENNDL）的输出。作者使用机器学习模型来预测网络在训练之前是否可以比某个阈值精度更好地运行。

与随机猜测相比，模型的执行效果要好16-20％。此外，作者在大量网络的准确性回归中发现普通最小二乘模型的确定系数为0.966。

分层强化学习作为人类任务交织的模型

论文名称：Hierarchical Reinforcement Learning as a Model of Human Task Interleaving

作者：Gebhardt Christoph /Oulasvirta Antti /Hilliges Otmar

发表时间：2020/1/4

论文链接：https://paper.yanxishe.com/review/8313

推荐理由：人们如何决定一项任务要持续多长时间，何时切换以及执行另一项任务？理解支持任务交错的机制是认知科学的一个长期目标。先前的工作提出了贪婪的启发法和最大化边际收益率的政策。然而，目前尚不清楚这种策略如何适应于提供多种任务，转换成本昂贵且回报延迟的日常环境。

在这里，作者开发了由强化学习（RL）驱动的监督控制的分层模型。主管级别使用特定于任务的近似效用估计值学习切换，这些估计值是在较低级别上计算的。即使在具有多个任务以及任意和不确定的报酬和成本结构的条件下，也可以从经验中学到分层的最优价值函数分解。该模型再现了任务交错的已知经验效果。与六任务问题（N = 211）中的近视基线相比，它可以更好地预测个人数据。结果支持分层RL作为任务交织的合理模型。

鲁棒经济模型预测控制的混合高斯过程方法

论文名称：A Hybrid Gaussian Process Approach to Robust Economic Model Predictive Control

作者：Rostam Mohammadreza /Nagamune Ryozo /Grebenyuk Vladimir

发表时间：2020/1/7

论文链接：https://paper.yanxishe.com/review/8308

推荐理由：为了减少控制器的保守性，本文提出了一种混合高斯过程（GP）方法，用于在未知未来扰动下进行鲁棒的经济模型预测控制。提出的混合GP是两种已知方法的组合，即核成分和非线性自回归。在分析预测结果之后，采用切换机制来选择这些方法中的一种来进行干扰预测。混合GP旨在通过使用过去的干扰测量来检测模式，而且还检测未知干扰中的意外行为。

在混合GP中还使用了一种新颖的遗忘因子概念，可以减轻较旧的测量的权重，从而基于最近的干扰值提高预测精度。}检测到的干扰信息用于减少预测的不确定性。经济模型的预测控制器。仿真结果表明，与其他基于GP的方法相比，在扰动具有可识别模式的情况下，该方法可以提高经济模型预测控制器的整体性能。

拓展阅读

由于篇幅有限，剩余五篇的论文推荐精选请扫描下方二维码继续阅读——

事实检测URL推荐的属性多关系注意力网络
论文名称：Attributed Multi-Relational Attention Network for Fact-checking URL Recommendation
持久内存的数据结构原语：一种评估
论文名称：Data Structure Primitives on Persistent Memory: An Evaluation
HandAugment：一种用于HANDS19挑战任务1-基于深度的3D手势估计的简单数据增强方法
论文名称：HandAugment: A Simple Data Augmentation for HANDS19 Challenge Task 1 -- Depth-Based 3D Hand Pose Estimation
纽约摄政科学考试从“ F”到“ A”：Aristo项目概述
论文名称：From 'F' to 'A' on the N.Y. Regents Science Exams: An Overview of the Aristo Project
信息理论模型预测Q学习
论文名称：Information Theoretic Model Predictive Q-Learning

（扫码直达，可直接跳转下载论文）

阅读原文浏览剩余五篇论文推荐

↓↓↓

登录查看更多

相关内容

高斯过程

关注 6

高斯过程（Gaussian Process, GP）是概率论和数理统计中随机过程（stochastic process）的一种，是一系列服从正态分布的随机变量（random variable）在一指数集（index set）内的组合。高斯过程中任意随机变量的线性组合都服从正态分布，每个有限维分布都是联合正态分布，且其本身在连续指数集上的概率密度函数即是所有随机变量的高斯测度，因此被视为联合正态分布的无限维广义延伸。高斯过程由其数学期望和协方差函数完全决定，并继承了正态分布的诸多性质

【CVPR2020】自监督的深度视觉测程与在线适应，Self-Supervised Deep Visual Odometry

专知会员服务

32+阅读 · 2020年5月14日