每日论文 | 面向统计学的神经网络介绍；梯度下降一阶和二阶通用框架；对智能体进行快速调整的线上方法

会员服务 ·

每日论文 | 面向统计学的神经网络介绍；梯度下降一阶和二阶通用框架；对智能体进行快速调整的线上方法

2018 年 10 月 20 日 论智

Neural Networks：A Review from a Statistical Perspective

这篇论文为统计学专业的读者解释了神经网络的概念，其中有一些统计学方法论的链接，鼓励大家进行跨学科研究。在统计学中，有很多能够用神经网络模型解释。本文堪称经典论文，建议读者收藏阅读。

地址：https://www.jstor.org/stable/2246275?seq=1#page_scan_tab_contents

First-order and second-order variants of the gradient descent: a unified framework

在这篇文章中，我们对机器学习中常用的梯度下降方法的一阶和二阶变体做了大致总结，我们提出了一种通用框架，其中6种方法都可以看作同一种方法的不同实例。

地址：https://arxiv.org/abs/1810.08102

Fast deep reinforcement learning using online adjustments from the past

这篇论文中，DeepMind的研究人员提出了短期价值调整（EVA），这种方法能让深度强化学习智能体在缓冲期快速作出调整，改变神经网络的预测值。EVA将最近类似情景记忆的架构融合到强化学习智能体中。最终研究人员证明，EVA在执行任务以及玩雅达利游戏中都表现良好。

地址：https://arxiv.org/abs/1810.08163

登录查看更多

相关内容

统计学

关注 46

统计学(Statistics)是研究收集、分析、解读、展示及组织(collection, analysis, interpretation, presentation and organization)数据的学科，通过量化地研究随机性，从而理解数据的产生机制，并进行判别、预测、优化、决策。统计学理论和方法是很多现代科学分支的支柱，其广泛的应用深刻地影响现代生活，具有代表性的应用领域包括：生物/医学(生物统计学，基因统计学，生物信息学，制药学等)
社会学/环境学(社会统计学，心理学，人口学，空间统计学，环境统计学等)
工业工程学(质量控制，可靠性分析等)
经济学/金融学(精算学，金融统计学等)
工程学/计算机科学(统计学习，数据挖掘，信号/图像采样/处理等)
基础科学(统计物理学，统计化学等)

【硬核书】不完全信息决策理论，467页pdf

专知会员服务

364+阅读 · 2020年6月24日

【实用书】使用R语言进行深度学习的介绍，240页pdf，一步一步的指导学习和实现使用R的深度学习模型

专知会员服务

42+阅读 · 2020年5月25日

多智能体深度强化学习的若干关键科学问题

专知会员服务

194+阅读 · 2020年5月24日

【ICML2020投稿论文-DeepMind】时序差分学习的推理与泛化，Temporal Difference Learning

专知会员服务

26+阅读 · 2020年3月16日