报告题目:

Deep Reinforcement Learning for Computer Vision

报告简介:

近年来,深度强化学习作为机器学习的基本技术之一得到了发展,并成功地应用于各种计算机视觉任务(表现出最先进的性能)。在本教程中,我们将概述深度强化学习技术的趋势,并讨论如何使用它们来提高各种计算机视觉任务的性能(解决计算机视觉中的各种问题)。首先,我们简要介绍了深度强化学习的基本概念,并指出了在不同的计算机视觉任务中所面临的主要挑战。其次,介绍了一些用于计算机视觉任务的深度强化学习技术及其种类:策略学习、注意感知学习、不可微优化和多智能体学习。第三,介绍了深度强化学习在计算机视觉不同领域的应用。最后,我们将讨论深度强化学习中的一些开放性问题,以说明未来如何进一步发展更先进的计算机视觉算法。

嘉宾介绍:

Jiwen Lu,副教授,中国清华大学,自动化系。清华大学自动化系副教授,2015.11-至今,新加坡高级数字科学中心研究科学家,2011.3-2015.11,2003.7-2007.7西安理工大学信息科学系助理讲师。

Liangliang Ren ,清华大学博士生,研究方向是计算机视觉与机器学习、度量学习与深度强化学习

成为VIP会员查看完整内容
0
38

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【导读】来自加州大学圣地亚哥分校《计算机视觉中的领域自适应》中生成式对抗网络GAN介绍

成为VIP会员查看完整内容
0
68

本文综述了元学习在图像分类、自然语言处理和机器人技术等领域的应用。与深度学习不同,元学习使用较少的样本数据集,并考虑进一步改进模型泛化以获得更高的预测精度。我们将元学习模型归纳为三类: 黑箱适应模型、基于相似度的方法模型和元学习过程模型。最近的应用集中在将元学习与贝叶斯深度学习和强化学习相结合,以提供可行的集成问题解决方案。介绍了元学习方法的性能比较,并讨论了今后的研究方向。

成为VIP会员查看完整内容
0
150

主题: GANs in computer vision: Introduction to generative learning

主要内容: 在这个综述系列文章中,我们将重点讨论计算机视觉应用程序的大量GANs。具体地说,我们将慢慢地建立在导致产生性对抗网络(GAN)进化的思想和原则之上。我们将遇到不同的任务,如条件图像生成,3D对象生成,视频合成。

目录:

  • 对抗学习
  • GAN(生成对抗网络)
  • 条件生成对抗网
  • 基于深度卷积
  • 生成对抗网络的无监督表示学习
  • Info GAN: Info最大化生成对抗网的表征学习

一般来说,数据生成方法存在于各种各样的现代深度学习应用中,从计算机视觉到自然语言处理。在这一点上,我们可以用肉眼生成几乎无法区分的生成数据。生成性学习大致可分为两大类:a)变分自编码器(VAE)和b)生成性对抗网络(GAN)。

成为VIP会员查看完整内容
0
44

主题: A Review on Deep Learning Techniques for Video Prediction

摘要: 预测,预期和推理未来结果的能力是智能决策系统的关键组成部分。鉴于深度学习在计算机视觉中的成功,基于深度学习的视频预测已成为有前途的研究方向。视频预测被定义为一种自我监督的学习任务,它代表了一个表示学习的合适框架,因为它展示了提取自然视频中潜在模式的有意义的表示的潜在能力。视频序列预测的深度学习方法。我们首先定义视频预测的基础知识,以及强制性的背景概念和最常用的数据集。接下来,我们会仔细分析根据拟议的分类法组织的现有视频预测模型,突出显示它们的贡献及其在该领域的意义。数据集和方法的摘要均附有实验结果,有助于在定量基础上评估现有技术。通过得出一些一般性结论,确定开放研究挑战并指出未来的研究方向来对本文进行总结。

成为VIP会员查看完整内容
0
24

题目

深度残差强化学习,Deep Residual Reinforcement Learning

关键字

强化学习,残差算法,机器学习

简介

我们在无模型和基于模型的强化学习设置中重新研究残差算法。 我们建议使用双向目标网络技术来稳定残差算法,从而产生DDPG的残差版本,该版本明显优于DeepMind Control Suite基准测试中的原始DDPG。 此外,我们发现残差算法是解决基于模型的规划中分布不匹配问题的有效方法。 与现有的TD(k)方法相比,我们的基于残差的方法对模型的假设更弱,并且性能提升更大。

作者

Shangtong Zhang, Wendelin Boehmer, Shimon Whiteson,来自牛津大学

成为VIP会员查看完整内容
0
31

简介:

使用Python、OpenCV库构建计算机视觉的实际应用程序。这本书讨论了不同方面的计算机视觉,如图像和对象检测,跟踪和运动分析及其应用实例。作者首先介绍了计算机视觉,然后使用Python从头开始创建OpenCV。下一节讨论专门的图像处理和分割,以及计算机如何存储和处理图像。这涉及到使用OpenCV库进行模式识别和图像标记。接下来,将使用OpenCV处理对象检测、视频存储和解释,以及人类检测。跟踪和运动也进行了详细的讨论。该书还讨论了如何使用CNN和RNN创建复杂的深度学习模型。最后对计算机视觉的应用现状和发展趋势进行了总结。

阅读本书之后,您将能够理解并使用Python、OpenCV实现计算机视觉及其应用程序。您还将能够使用CNN和RNN创建深度学习模型,并了解这些前沿的深度学习架构是如何工作的。

您将学习

  • 了解什么是计算机视觉以及它在智能自动化系统中的整体应用。
  • 探索构建计算机视觉应用程序所需的深度学习技术。
  • 使用OpenCV、Python和NumPy中的最新技术构建复杂的计算机视觉应用程序。
  • 创建实际的应用程序,如:人脸检测和识别,手写识别,对象检测,跟踪和运动分析。

作者:

Sunila Gollapudi是Broadridge Financial Solutions India (Pvt)有限公司的执行副总裁。拥有超过17年的架构、设计和开发以客户为中心、企业级和数据驱动的解决方案的经验。在过去的十年中,她主要专注于银行和金融服务领域,是一名数据鉴赏家和架构师,擅长设计一个通过分析最大化数据价值的整体数据策略。她的专长包括通过综合业务和领域驱动因素以及大数据工程和分析领域的新兴技术趋势来构建整体智能自动化战略;领导针对CI/CD的云迁移和DevOps战略;指导应用程序现代化、重用和技术标准化计划。

成为VIP会员查看完整内容
0
64

主题: Reinforcement Learning 101

摘要: 强化学习是现代人工智能领域最热门的研究课题之一,它的普及程度也在不断提高。让我们看看开始学习RL需要知道的5件有用的事情:

  • 强化学习是什么?它和其他机器学习相比怎么样?
  • 如何确切表示一个基本强化学习问题?
  • 一些最有用的强化学习算法是什么?
  • 强化学习有哪些实际应用?
  • 如何开始强化学习?

作者简介: Shweta Bhatt,理学硕士,数据科学家,谷歌开发人员机器学习专家。

成为VIP会员查看完整内容
0
34

论文题目

视频游戏中深度强化学习的研究综述,A Survey of Deep Reinforcement Learning in Video

论文摘要

摘要深度强化学习(DRL)自提出以来取得了很大的成就。通常,DRL代理在每个步骤都接收高维输入,并根据基于深度神经网络的策略进行操作。这种学习机制通过端到端的方法更新策略以最大化回报。本文综述了DRL方法的研究进展,包括基于价值的方法、基于策略梯度的方法和基于模型的方法,比较了它们的主要技术和性能,并指出DRL在智能游戏中的重要作用。我们还回顾了DRL在各种电子游戏中的成就,包括经典的街机游戏、第一人称视角游戏和多智能体实时战略游戏,从2D到3D,从单智能体到多智能体,大量带有DRL的电子游戏AIs都取得了超人的性能,在这个领域还有一些挑战。因此,我们还讨论了将DRL方法应用于该领域的一些关键点,包括探索性开发、样本效率、泛化和迁移、多智能体学习、不完全信息和延迟备用研究,以及一些研究方向。

论文作者

Kun Shao, Zhentao Tang, Yuanheng Zhu,IEEE成员。Nannan Li, Dongbin Zhao,IEEE资深会员。

成为VIP会员查看完整内容
0
23
小贴士
相关论文
A Survey of Methods for Low-Power Deep Learning and Computer Vision
Abhinav Goel,Caleb Tung,Yung-Hsiang Lu,George K. Thiruvathukal
9+阅读 · 2020年3月24日
Q-value Path Decomposition for Deep Multiagent Reinforcement Learning
Yaodong Yang,Jianye Hao,Guangyong Chen,Hongyao Tang,Yingfeng Chen,Yujing Hu,Changjie Fan,Zhongyu Wei
15+阅读 · 2020年2月10日
Deep Learning for Energy Markets
Michael Polson,Vadim Sokolov
3+阅读 · 2019年4月10日
Parsimonious Bayesian deep networks
Mingyuan Zhou
3+阅读 · 2018年10月17日
Image Captioning based on Deep Reinforcement Learning
Haichao Shi,Peng Li,Bo Wang,Zhenyu Wang
6+阅读 · 2018年9月13日
Antoine J. -P. Tixier
10+阅读 · 2018年8月30日
CIRL: Controllable Imitative Reinforcement Learning for Vision-based Self-driving
Xiaodan Liang,Tairui Wang,Luona Yang,Eric Xing
4+阅读 · 2018年7月10日
Vinicius Zambaldi,David Raposo,Adam Santoro,Victor Bapst,Yujia Li,Igor Babuschkin,Karl Tuyls,David Reichert,Timothy Lillicrap,Edward Lockhart,Murray Shanahan,Victoria Langston,Razvan Pascanu,Matthew Botvinick,Oriol Vinyals,Peter Battaglia
4+阅读 · 2018年6月5日
Zhanxiang Feng,Jianhuang Lai,Xiaohua Xie
7+阅读 · 2018年3月30日
Jiayuan Gu,Han Hu,Liwei Wang,Yichen Wei,Jifeng Dai
4+阅读 · 2018年3月19日
Top