微软亚洲研究院资深研究员梅涛:原来视频可以这么玩了! | CCF-GAIR 2017

2017 年 7 月 9 日 AI科技评论 思颖

7 月 9 日,由 CCF 主办,雷锋网与香港中文大学承办的第二届 CCF-GAIR 全球人工智能与机器人峰会进入了第三天。在 CV + 专场首场,微软亚洲研究院资深研究员梅涛为大会带来了题为《Video Content 3C: Creation, Curation, Consumption》的分享,即视频的创造、处理和消费。

为什么要讲视频的内容,他提到如下几点。

一是视频跟图像相比更加深入,视频是 To B 的东西,但是研究视频是很大的挑战,有很大的荣誉;第二是大家看到视觉领域比如人脸、安防方面的进展,视频领域是比较崭新的东西。第三是他本人在十年前做视频方面的研究,所有人都说视频是下一个风口,今天看来这个说法也是对的。

要做视觉问题基本上分三个步骤:

第一,理解一个东西,比如说识别一个桌子,在这里要了解一些线条;第二,人为设计一些特征来描述;第三,设计一些分类器。

现在的深度学习的错误率在不断降低,image Classification 从最早的 8 层到 20 多层,到现在能达到 152 层。

视频的创作、处理和消费:

  • creation

这里面有一个基本概念,Video 的产生是先把 Video 切成一个一个的镜头,可以看成是一个一个断码,然后每一个镜头再编成一个故事,每几个语言可以放成一个故事。每一个镜头可以分成 Sub-shots,然后有一个数据。

  • curation

有了 Video 之后要做的事情是给 Video 打标签,至今为止可以打上 1000 个的静态标签,有了这些静态标签就可以设置到内容里面去。

另外还可以分析动作,给你一个 Video,能不能生成一句话来描述这个 Video,以前我们说这个 Video 是一个舞蹈,现在可以告诉你这是一个什么舞蹈。可以实时产生字母,自动评价,例如微软小冰,你上传视频给小冰,它会夸赞你。小冰还可以写诗。

也可以将 Video 进行编辑,加上滤镜,或是做风格的转换,把自然的 Video 变得非常卡通。Video 中的人物分割出来可以放到另外一个虚拟的场景里面去。你可以想象,当两个人在异地谈恋爱的时候,我们能够给他一个房间,让他们在房间里面进行聊天。

另外,也可以提供服务,让 image、Video 变得更好,这都是机器产生的效果。加上人工的处理,视频就可以变得更加时尚。

  • consumption

梅涛提到,做 Video 广告有两个问题需要解决:第一个问题是广告到底放在 Video 的什么位置;第二个问题是选什么样的广告,这个广告跟你插入点的信息是不是相关,使得用户接受度更加好。

他们的解决方案,将 Video 进行分解,做一系列的动作,从而符合广告商的需求或满足不同用户的需求。

最后梅涛总结到,在做科研的人看来,AI 也好,深度学习也好,落地都有很长的路要走,我们要脚踏实地的一个一个的去实现。

登录查看更多
0

相关内容

梅涛博士,京东AI研究院副院长,京东集团技术副总裁,国际电气电子工程师学会和国际模式识别学会会士 (Fellow of IEEE and IAPR),国际计算机协会杰出科学家。他领导京东人工智能事业部计算机视觉领域的基础研究、技术创新和产品研发,并探索在无界零售、智能物流、云计算、新媒体等领域的应用。加入京东之前,梅涛博士担任微软亚洲研究院资深研究员,其研究成果先后20余次被成功转化到微软的关键产品和服务中。他在多媒体分析和计算机视觉领域发表论文200余篇,先后12次荣获最佳论文奖,并拥有50余项美国和国际专利(其中20余项授权)。他领导的研究团队多次在国际图像、视频、人脸、人体姿态识别和搜索比赛中排名第一。他目前同时担任 IEEE 和 ACM 视觉与多媒体汇刊(IEEE TIP, IEEE TCSVT 和 ACM TOMM)等顶级学术期刊的编委,并且是 2018 年 ACM Multimedia 的程序委员会主席和 2019 年 IEEE ICME 的大会共同主席。他是 IEEE信号处理学会杰出工业演讲者,并且担任中国科学技术大学、复旦大学、香港中文大学(深圳)和韩国延世大学的客座教授。个人主页:https://taomei.me/
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
34+阅读 · 2020年6月17日
【ICIP2019教程-NVIDIA】图像到图像转换,附7份PPT下载
专知会员服务
53+阅读 · 2019年11月20日
人机交互如何改变人类生活 | 公开课笔记
人工智能头条
3+阅读 · 2018年7月9日
梅涛:“看图说话”——人类走开,我AI来!|VALSE2017之十二
视频行为识别年度进展
深度学习大讲堂
34+阅读 · 2017年6月12日
dynnode2vec: Scalable Dynamic Network Embedding
Arxiv
13+阅读 · 2018年12月6日
Arxiv
5+阅读 · 2018年5月22日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
6+阅读 · 2018年1月14日
VIP会员
相关论文
Top
微信扫码咨询专知VIP会员