题目: Capsule Networks for Computer Vision

报告简介: 胶囊网络提供了一种有效的方法来建模实体之间的部分对整个关系,并允许学习视点不变表示。 通过这种改进的表示学习,胶囊网络能够在多个域中实现良好的性能,而参数数量却大大减少。 最近,胶囊网络已显示出人类动作在视频中的定位,医学图像中的对象分割以及文本分类的最新结果。 本教程将提供对胶囊网络的基本了解,并且我们将讨论其在各种计算机视觉任务中的使用,例如图像分类,对象分割和活动检测。

嘉宾介绍:

Mubarak Shah,计算机科学讲座教授,UCF计算机视觉研究中心的创始主任。他的研究兴趣包括:视频监视,视觉跟踪,人类活动识别,拥挤场景的视觉分析,视频注册,无人机视频分析等。Shah博士是IEEE,AAAS,IAPR和SPIE的研究员。 2006年,他被授予飞马教授奖,这是UCF的最高奖项。他是ACM杰出的演讲者。他曾在1997-2000年担任IEEE杰出访客发言人,并于1997年获得IEEE杰出工程教育家奖。他于1999年获得了哈里斯公司的工程成就奖,并于1995、1997和2000年获得了联合国开发计划署的TOKTEN奖; 1995年和2003年授予教学激励计划奖,2003年和2009年授予研究激励奖,2005年和2006年授予百万富翁俱乐部奖,2007年授予大学杰出研究员奖,并为2005年ICCV荣誉奖。挑战问题,并在2005年ACM多媒体会议上获得最佳论文奖提名。他是视频计算国际丛书的编辑。 《机器视觉与应用》杂志主编,《 ACM计算调查》杂志副主编。他是IEEE Transactions on PAMI的副编辑,也是《国际计算机视觉视频计算杂志》特刊的特约编辑。

Rawat博士是UCF计算机视觉研究中心的助理教授。他的研究兴趣在于计算机视觉,机器学习,社交计算和多媒体的交叉领域。他于2012年至2017年在新加坡国立大学计算机学院获得计算机科学博士学位,并在该大学的多媒体分析与综合实验室与Mohan Kankanhalli教授一起工作。他的博士论文致力于利用社交媒体和相机传感器增强用户的摄影体验。它的重点是计算媒体美学和对用于摄影的社交媒体图像的分析。他于2017-2019年在UCF计算机视觉研究中心与Mubarak Shah教授进行了博士后培训。他于2009年在瓦拉纳西IIT-BHU印度理工学院获得了计算机科学与工程学士学位。在2012年夏季加入NUS之前,他曾于2009年至2012年在印度Mentor Graphics的Praveen Shukla工作。在Veloce Emulation团队工作。他是乒乓球爱好者,并且在这项运动中赢得了许多奖牌。

成为VIP会员查看完整内容
0
9

相关内容

标跟踪是指:给出目标在跟踪视频第一帧中的初始状态(如位置,尺寸),自动估计目标物体在后续帧中的状态。 目标跟踪分为单目标跟踪和多目标跟踪。 人眼可以比较轻松的在一段时间内跟住某个特定目标。但是对机器而言,这一任务并不简单,尤其是跟踪过程中会出现目标发生剧烈形变、被其他目标遮挡或出现相似物体干扰等等各种复杂的情况。过去几十年以来,目标跟踪的研究取得了长足的发展,尤其是各种机器学习算法被引入以来,目标跟踪算法呈现百花齐放的态势。2013年以来,深度学习方法开始在目标跟踪领域展露头脚,并逐渐在性能上超越传统方法,取得巨大的突破。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

胶囊网络(Capsule Networks)图领奖得主Geoffrey Hinton在17年提出的一种新型神经网络结构,可以克服卷积神经网络存在的一些问题。胶囊网络提供了一个有效的建模实体间局部到全局关系的方法,并可以学习视角不变表示。通过这种提升的表示学习,胶囊网络可以在多个领域下用更少的参数取得好的性能。最近,胶囊网络在视频中人类行为定位、医学图像目标分割、文本分类等任务上都取得了最好的效果。

布法罗大学最近的课程《胶囊网络》课件讲述了概念算法等,包含57页ppt,值得一看!

成为VIP会员查看完整内容
0
38

简介:

使用Python、OpenCV库构建计算机视觉的实际应用程序。这本书讨论了不同方面的计算机视觉,如图像和对象检测,跟踪和运动分析及其应用实例。作者首先介绍了计算机视觉,然后使用Python从头开始创建OpenCV。下一节讨论专门的图像处理和分割,以及计算机如何存储和处理图像。这涉及到使用OpenCV库进行模式识别和图像标记。接下来,将使用OpenCV处理对象检测、视频存储和解释,以及人类检测。跟踪和运动也进行了详细的讨论。该书还讨论了如何使用CNN和RNN创建复杂的深度学习模型。最后对计算机视觉的应用现状和发展趋势进行了总结。

阅读本书之后,您将能够理解并使用Python、OpenCV实现计算机视觉及其应用程序。您还将能够使用CNN和RNN创建深度学习模型,并了解这些前沿的深度学习架构是如何工作的。

您将学习

  • 了解什么是计算机视觉以及它在智能自动化系统中的整体应用。
  • 探索构建计算机视觉应用程序所需的深度学习技术。
  • 使用OpenCV、Python和NumPy中的最新技术构建复杂的计算机视觉应用程序。
  • 创建实际的应用程序,如:人脸检测和识别,手写识别,对象检测,跟踪和运动分析。

作者:

Sunila Gollapudi是Broadridge Financial Solutions India (Pvt)有限公司的执行副总裁。拥有超过17年的架构、设计和开发以客户为中心、企业级和数据驱动的解决方案的经验。在过去的十年中,她主要专注于银行和金融服务领域,是一名数据鉴赏家和架构师,擅长设计一个通过分析最大化数据价值的整体数据策略。她的专长包括通过综合业务和领域驱动因素以及大数据工程和分析领域的新兴技术趋势来构建整体智能自动化战略;领导针对CI/CD的云迁移和DevOps战略;指导应用程序现代化、重用和技术标准化计划。

成为VIP会员查看完整内容
0
53

报告题目:

Visual Recognition of Families In the Wild

报告简介:

亲属关系自动识别具有广泛的应用价值。首先,协助法医调查,因为亲属关系是一个强有力的线索,可以缩小搜索空间(例如,知道波士顿爆炸案是兄弟可能有助于更快地确定嫌疑人)。简言之,这类技术可能带来许多好处:消费者(例如,自动照片库管理)、学者(例如,历史血统和家谱研究)、数据分析仪(例如,基于社交媒体的分析)、调查员(例如,失踪儿童和人口贩运案件——例如,然而,在网上找到的失踪儿童不太可能出现在任何数据库中,甚至不太可能是难民。除了基于应用的问题之外,正如已经暗示的,亲属关系是一个强大的线索,可以作为一个人脸属性,在更一般的人脸识别问题中,能够大大减少搜索空间。有了我们的FIW数据库,我们可以以比以往任何时候都大得多的规模提出这一相对较新和具有挑战性的问题(例如,64.4万对人脸的亲属关系验证,而不是只有2000对,1000个家庭的家庭分类,而不是只有101个)。最后,我们也希望FIW能作为一个丰富的资源,进一步将基于人脸识别的问题的语义鸿沟与更广泛的人机交互激励联系起来。

嘉宾介绍:

Joseph Robinson & Ming Shao,获得电气和计算机工程学士学位(2014年),并在东北大学(NEU)攻读计算机工程博士学位,同时兼任兼职教师:设计和教授数据分析本科课程。研究方向是应用机器视觉,重点是人脸、深度学习、多媒体和大型数据库。此前,带领球队首次亮相特雷维德(MED,获得第三名最佳准确率)。此外,建立了许多图像和视频数据集,其中最引人注目的是FIW。担任各种研讨会和挑战(如NECV17、RFIW@ACM-MM17、RFIW@FG18、AMFG@CVPR18、FacesMM@ICME18)、教程(ACM-MM18)、PC成员(如CVPR、FG、MIRP、MMEDIA、AAAI)、评审员(如IEEE Trans)的组织主席和主持人。在生物医学电路和系统,图像处理,模式分析和机器智能)和领导职位,如IEEE@NEU总裁和IEEE SAC R1地区的关系官员。完成了两项NSF REUs(2010和2011);Analogic Corporation和BBN Technology的合作;在麻省理工学院林肯实验室(2014)、系统与技术研究(2016和2017)、Snap Inc.(即Snapchat)(2018)和ISMConnect(2019)实习。

Ming Shao,Joseph Robinson

成为VIP会员查看完整内容
0
9

报告题目:

Deep Reinforcement Learning for Computer Vision

报告简介:

近年来,深度强化学习作为机器学习的基本技术之一得到了发展,并成功地应用于各种计算机视觉任务(表现出最先进的性能)。在本教程中,我们将概述深度强化学习技术的趋势,并讨论如何使用它们来提高各种计算机视觉任务的性能(解决计算机视觉中的各种问题)。首先,我们简要介绍了深度强化学习的基本概念,并指出了在不同的计算机视觉任务中所面临的主要挑战。其次,介绍了一些用于计算机视觉任务的深度强化学习技术及其种类:策略学习、注意感知学习、不可微优化和多智能体学习。第三,介绍了深度强化学习在计算机视觉不同领域的应用。最后,我们将讨论深度强化学习中的一些开放性问题,以说明未来如何进一步发展更先进的计算机视觉算法。

嘉宾介绍:

Jiwen Lu,副教授,中国清华大学,自动化系。清华大学自动化系副教授,2015.11-至今,新加坡高级数字科学中心研究科学家,2011.3-2015.11,2003.7-2007.7西安理工大学信息科学系助理讲师。

Liangliang Ren ,清华大学博士生,研究方向是计算机视觉与机器学习、度量学习与深度强化学习

成为VIP会员查看完整内容
0
26

教程题目:Learning from 3D (Point Cloud) Data

教程简介

在(3D)点云上学习对于自动驾驶、机器人感知、VR/AR、游戏和安全等广泛的新兴应用至关重要。由于激光雷达、3D相机和RGB-D等3D传感器的普及,这种需求最近有所增加。点云由成千上万个点组成,是对传统2D相机的补充。点云数据上的三维学习算法是一种全新的、令人兴奋的方法,可以解决三维分类、检测、语义分割和人脸识别等众多核心问题。本教程涵盖点云数据的需求、捕获数据的背景、3D表示、新兴应用程序、核心问题、最新的学习算法(例如,基于体素、基于点的算法等)和未来的研究机会。还将展示最近工作在几个三维基准,如ScanNet, KITTI等。

组织者:

徐宏民教授是一位活跃的研究人员,致力于大型图像/视频检索/挖掘、视觉识别和机器智能。他是国立台湾大学计算机科学与资讯工程学系的教授。他和他的团队获得了多媒体和计算机视觉研究领域的技术奖项,包括IBM research的Pat Goldberg Memorial最佳论文奖(2018),2017年ACM多媒体大会最佳新创意论文奖,IARPA变脸大赛第一名(CVPR 2018), 2011年ACM多媒体大挑战一等奖,2013/2014年度ACM多媒体大挑战多模态奖等。徐教授热衷于通过学术-产业合作和共同创办创业公司来实现对商业成果的先进研究。2014年,他是微软雷德蒙德研究院的访问科学家,2016-2017年,他在IBM TJ Watson研究中心休了一年的年假。他曾担任《IEEE视频技术电路与系统学报》(TCSVT)和《IEEE多媒体学报》(IEEE Multimedia Transactions on Video Technology)的副主编,并担任《IEEE多媒体杂志》(2010 - 2017)的编委。

成为VIP会员查看完整内容
0
7

题目: Visual Recognition and Beyond

报告简介: 本教程涵盖了视觉识别研究前沿的主题。 我们将讨论来自图像和视频的实例级识别的最新进展,详细介绍视觉识别任务系列中的最新工作。 讲座涵盖了图像分类,视频分类,对象检测,动作检测,实例分割,语义分割,全景分割和姿势估计背后的方法和原理。

报告目录:

  • 目标检测与实例分割
  • 全局分割: Task and Approaches
  • 2D图像预测3D形状
  • 视频分类与检测

嘉宾介绍:

Ross Girshick,是Facebook人工智能研究(FAIR)的一名研究科学家,致力于计算机视觉和机器学习。2012年,他在Pedro Felzenszwalb的指导下获得了芝加哥大学的计算机科学博士学位。加入FAIR之前,罗斯曾在微软研究院(Microsoft Research)、雷德蒙(Redmond)和加州大学伯克利分校(University of California, Berkeley)做研究员,他的兴趣包括实例级别的对象理解和将自然语言处理与计算机视觉相结合的视觉推理挑战。他获得了2017年PAMI青年研究员奖,并以开发R-CNN(基于区域的卷积神经网络)方法来检测对象而闻名。2017年,还凭借《面具R-CNN》在ICCV获得马尔奖。

Justin Johnson,斯坦福大学博士,导师是计算机视觉领域顶级学者李飞飞博士。研究兴趣包括计算机视觉和机器学习方面,涉及到视觉推理、视觉和语言,以及使用深层神经网络生成图像。Johnson目前是Facebook AI Research的研究科学家。从2019年秋季开始,我将加入密歇根大学计算机科学与工程专业,担任助理教授。Johnson在2018年夏天完成博士学位,其博士论文组成式视觉智能《Compositional visual intelligence》,195页详述采用组合式学习的方法对计算机视觉中图像描述、视觉问答、文本图像生成三方面的问题进行了研究,是组合式视觉智能的代表性研究工作。

成为VIP会员查看完整内容
0
14
小贴士
相关VIP内容
专知会员服务
38+阅读 · 2月29日
相关资讯
相关论文
Neural Image Captioning
Elaina Tan,Lakshay Sharma
4+阅读 · 2019年7月2日
Younjoo Seo,Andreas Loukas,Nathanaël Perraudin
3+阅读 · 2019年6月5日
A Capsule Network-based Embedding Model for Knowledge Graph Completion and Search Personalization
Dai Quoc Nguyen,Thanh Vu,Tu Dinh Nguyen,Dat Quoc Nguyen,Dinh Phung
3+阅读 · 2019年3月6日
Shaohui Kuang,Deyi Xiong
3+阅读 · 2018年6月12日
Vikram Mullachery,Vishal Motwani
4+阅读 · 2018年5月13日
Yuanlu Xu,Lei Qin,Xiaobai Liu,Jianwen Xie,Song-Chun Zhu
5+阅读 · 2018年3月29日
Alexander Trott,Caiming Xiong,Richard Socher
4+阅读 · 2018年3月2日
Quanshi Zhang,Ying Nian Wu,Song-Chun Zhu
12+阅读 · 2018年2月14日
Łukasz Kaiser,Samy Bengio
6+阅读 · 2018年1月29日
Runmin Cong,Jianjun Lei,Huazhu Fu,Weisi Lin,Qingming Huang,Xiaochun Cao,Chunping Hou
3+阅读 · 2017年11月4日
Top