报告题目:
Deep Reinforcement Learning for Computer Vision
报告简介:
近年来,深度强化学习作为机器学习的基本技术之一得到了发展,并成功地应用于各种计算机视觉任务(表现出最先进的性能)。在本教程中,我们将概述深度强化学习技术的趋势,并讨论如何使用它们来提高各种计算机视觉任务的性能(解决计算机视觉中的各种问题)。首先,我们简要介绍了深度强化学习的基本概念,并指出了在不同的计算机视觉任务中所面临的主要挑战。其次,介绍了一些用于计算机视觉任务的深度强化学习技术及其种类:策略学习、注意感知学习、不可微优化和多智能体学习。第三,介绍了深度强化学习在计算机视觉不同领域的应用。最后,我们将讨论深度强化学习中的一些开放性问题,以说明未来如何进一步发展更先进的计算机视觉算法。
嘉宾介绍:
Jiwen Lu,副教授,中国清华大学,自动化系。清华大学自动化系副教授,2015.11-至今,新加坡高级数字科学中心研究科学家,2011.3-2015.11,2003.7-2007.7西安理工大学信息科学系助理讲师。
Liangliang Ren ,清华大学博士生,研究方向是计算机视觉与机器学习、度量学习与深度强化学习
本文综述了元学习在图像分类、自然语言处理和机器人技术等领域的应用。与深度学习不同,元学习使用较少的样本数据集,并考虑进一步改进模型泛化以获得更高的预测精度。我们将元学习模型归纳为三类: 黑箱适应模型、基于相似度的方法模型和元学习过程模型。最近的应用集中在将元学习与贝叶斯深度学习和强化学习相结合,以提供可行的集成问题解决方案。介绍了元学习方法的性能比较,并讨论了今后的研究方向。
主题: GANs in computer vision: Introduction to generative learning
主要内容: 在这个综述系列文章中,我们将重点讨论计算机视觉应用程序的大量GANs。具体地说,我们将慢慢地建立在导致产生性对抗网络(GAN)进化的思想和原则之上。我们将遇到不同的任务,如条件图像生成,3D对象生成,视频合成。
目录:
一般来说,数据生成方法存在于各种各样的现代深度学习应用中,从计算机视觉到自然语言处理。在这一点上,我们可以用肉眼生成几乎无法区分的生成数据。生成性学习大致可分为两大类:a)变分自编码器(VAE)和b)生成性对抗网络(GAN)。
主题: A Review on Deep Learning Techniques for Video Prediction
摘要: 预测,预期和推理未来结果的能力是智能决策系统的关键组成部分。鉴于深度学习在计算机视觉中的成功,基于深度学习的视频预测已成为有前途的研究方向。视频预测被定义为一种自我监督的学习任务,它代表了一个表示学习的合适框架,因为它展示了提取自然视频中潜在模式的有意义的表示的潜在能力。视频序列预测的深度学习方法。我们首先定义视频预测的基础知识,以及强制性的背景概念和最常用的数据集。接下来,我们会仔细分析根据拟议的分类法组织的现有视频预测模型,突出显示它们的贡献及其在该领域的意义。数据集和方法的摘要均附有实验结果,有助于在定量基础上评估现有技术。通过得出一些一般性结论,确定开放研究挑战并指出未来的研究方向来对本文进行总结。
题目
深度残差强化学习,Deep Residual Reinforcement Learning
关键字
强化学习,残差算法,机器学习
简介
我们在无模型和基于模型的强化学习设置中重新研究残差算法。 我们建议使用双向目标网络技术来稳定残差算法,从而产生DDPG的残差版本,该版本明显优于DeepMind Control Suite基准测试中的原始DDPG。 此外,我们发现残差算法是解决基于模型的规划中分布不匹配问题的有效方法。 与现有的TD(k)方法相比,我们的基于残差的方法对模型的假设更弱,并且性能提升更大。
作者
Shangtong Zhang, Wendelin Boehmer, Shimon Whiteson,来自牛津大学
简介:
使用Python、OpenCV库构建计算机视觉的实际应用程序。这本书讨论了不同方面的计算机视觉,如图像和对象检测,跟踪和运动分析及其应用实例。作者首先介绍了计算机视觉,然后使用Python从头开始创建OpenCV。下一节讨论专门的图像处理和分割,以及计算机如何存储和处理图像。这涉及到使用OpenCV库进行模式识别和图像标记。接下来,将使用OpenCV处理对象检测、视频存储和解释,以及人类检测。跟踪和运动也进行了详细的讨论。该书还讨论了如何使用CNN和RNN创建复杂的深度学习模型。最后对计算机视觉的应用现状和发展趋势进行了总结。
阅读本书之后,您将能够理解并使用Python、OpenCV实现计算机视觉及其应用程序。您还将能够使用CNN和RNN创建深度学习模型,并了解这些前沿的深度学习架构是如何工作的。
您将学习
作者:
Sunila Gollapudi是Broadridge Financial Solutions India (Pvt)有限公司的执行副总裁。拥有超过17年的架构、设计和开发以客户为中心、企业级和数据驱动的解决方案的经验。在过去的十年中,她主要专注于银行和金融服务领域,是一名数据鉴赏家和架构师,擅长设计一个通过分析最大化数据价值的整体数据策略。她的专长包括通过综合业务和领域驱动因素以及大数据工程和分析领域的新兴技术趋势来构建整体智能自动化战略;领导针对CI/CD的云迁移和DevOps战略;指导应用程序现代化、重用和技术标准化计划。
主题: Reinforcement Learning 101
摘要: 强化学习是现代人工智能领域最热门的研究课题之一,它的普及程度也在不断提高。让我们看看开始学习RL需要知道的5件有用的事情:
作者简介: Shweta Bhatt,理学硕士,数据科学家,谷歌开发人员机器学习专家。
论文题目
视频游戏中深度强化学习的研究综述,A Survey of Deep Reinforcement Learning in Video
论文摘要
摘要深度强化学习(DRL)自提出以来取得了很大的成就。通常,DRL代理在每个步骤都接收高维输入,并根据基于深度神经网络的策略进行操作。这种学习机制通过端到端的方法更新策略以最大化回报。本文综述了DRL方法的研究进展,包括基于价值的方法、基于策略梯度的方法和基于模型的方法,比较了它们的主要技术和性能,并指出DRL在智能游戏中的重要作用。我们还回顾了DRL在各种电子游戏中的成就,包括经典的街机游戏、第一人称视角游戏和多智能体实时战略游戏,从2D到3D,从单智能体到多智能体,大量带有DRL的电子游戏AIs都取得了超人的性能,在这个领域还有一些挑战。因此,我们还讨论了将DRL方法应用于该领域的一些关键点,包括探索性开发、样本效率、泛化和迁移、多智能体学习、不完全信息和延迟备用研究,以及一些研究方向。
论文作者
Kun Shao, Zhentao Tang, Yuanheng Zhu,IEEE成员。Nannan Li, Dongbin Zhao,IEEE资深会员。