基于深度学习的视频内容识别

2017 年 8 月 18 日 计算机视觉战队 Edison_G

好久未和老相好的您们面对面的知识交流过,不知道大家最近科研是否顺利,有没有新的想法和创新,我都会祝学术界的您科研硕果累累,祝工业界的您工程完善更多智能化功能,造福人类,推动人工智能的进步!今天给您讲讲视频大数据和视频内容的识别(部分内容来自复旦大学-计算机科学技术学院薛向阳、姜育刚,谢谢参考阅读)。


视频大数据

作为目前最火热的词汇之一,大数据在各个领域都已有了较为成熟的应用。在视频监控领域,大数据时代正悄悄来临。

现代社会的信息量正以飞快的速度增长,这些信息里又积累着大量的数据。预计到2025年,每年产生的数据信息将会有超过1/3的内容驻留在云平台中或借助云平台处理。我们需要对这些数据进行分析和处理,以获取更多有价值的信息。在未来的“智慧城市”中,会有越来越大的结构化以及非结构化的数据。那么我们如何高效地存储和管理这些数据,如何分析这些数据呢?

答案是:我们需要强有力的大数据处理系统进行支撑

    在城市安全、交通管理中将部署大量的视频监控设备,这些视频监控设备将产生大量的视频及其相关的数据,如交通卡口数据达到十亿条甚至更大级别,人像库的数据量达到千万条甚至更大级别。

    针对如此大级别的数据量,当前系统会逐渐暴露出数据检索速度越来越慢;数据统计、分析效率越来越低等问题,这些问题都需要一个成熟的技术来解决。随着“智慧城市”中城市安全、智慧交通等的迅速发展,城市中非结构化的数据量越来越大。视频大数据技术侧重帮助各类客户从日趋海量的非结构化视频数据中快速发掘高价值的信息,协助客户提升其决策的效率和精准度。因此,视频大数据的处理好坏成了客户关注的焦点,视频大数据的处理技术也成了厂家能力的体现。

    针对“智慧城市”建设中大量视频数据的快速检索、统计分析的需求,海康威视,佳都科技等视频领域的领军企业已有了成熟的视频大数据的解决方案,目前已应用多个“智慧城市”的建设中。

视频大数据技术能够解决当前系统处理海量视频及相关数据能力不足的问题,帮助客户从海量的视频数据中快速挖掘高价值的信息,协助客户提升其决策的效率和精准度。可以预见在未来的“智慧城市”建设中,视频的数据量会爆炸性增长,对海量视频数据处理系统的要求会越来越高,对视频数据挖掘的能力要求越来越强,视频大数据平台将引入越来越多的AI机器学习,深度学习、智能图算法等尖端技术来提高整个系统的智能化水平。


q全球互联网分析报告(由思科公司发布)

  • 在2019年,全球每月产生互联网视频的总时长将会达到五百万年

  • 全球互联网视频流量占总流量的比例预计将由2014年的67%增长至2019年的80%

  • 消费视频点播流量将在2019年之前增长一倍


我们还是来说说视频内容的知识,先来说说现在这领域的视频数据集的构建。


哥伦比亚消费视频数据集

  • Originalunedited videos captured by ordinaryconsumers Interestingand very diverse contents;

  • Veryweakly indexed;

  • On average, 3 tags per consumer video on YouTube vs. 9 tags each YouTube video has。

Y.-G. Jiang et al., Consumer Video Understanding: A Benchmark Database and An Evaluation of Human and Machine Performance, ACM ICMR 2011.


大规模动作识别比赛的数据

  • THUMOSChallenge

101类别;分别与ICCV2013、ECCV2014、CVPR2015合办


深度视频学习

Video Classification with Regularized DNN

Z. Wu, Y.-G. Jiang et al., Exploring Inter-feature and Inter-class Relationships with Deep Neural Networks for Video Classification, ACM Multimedia 2014 (full paper)

Feature Fusion

Bothearly fusion and late fusion neglect  the hidden correlations across differentfeatures.

ClassRelationships

Similar Video Semantics

Approach

DNNLearning Scheme

- Calculate prediction error

- Update weights in a BP manner 

在该过程,注入了特征和类别关系。





Algorithm:

1、先初始化权重,Ω和Ψ是单位矩阵。

2、有一个循环,预测误差和更新权重矩阵,更新特征及类别关系Ω和Ψ。

其他框架:

Two-Stream CNN

Hao Ye, Zuxuan Wu, Rui-Wei Zhao, Xi Wang, Yu-Gang Jiang, et al. Evaluating Two-Stream CNN for Video Classification, ICMR 2015




Z. Wu, X. Wang, Y.-G. Jiang et al., Modeling Spatial-Temporal Clues in a Hybrid Deep Learning Framework for Video Classification, accepted to ACM Multimedia 2015 (Full Paper)




Z. Wu, X. Wang, Y.-G. Jiang et al., manuscript under review. 




特征融合方法
目标函数:

经验损失。可以是Logistic回归:

然后加一个类别关系的正则项:

在训练过程中,是通过相关系数矩阵V得到:

其可以从高相关类中学习有用的知识。

最后再加一个参数W的正则项(为了增加鲁棒性),整个公式为:

最后附一个视频小样仅供参考:






登录查看更多
10

相关内容

智慧城市(英语:Smart City)是指利用各种信息技术或创新意念,集成城市的组成系统和服务,以提升资源运用的效率,优化城市管理和服务,以及改善市民生活质量。智慧城市把新一代信息技术充分运用在城市的各行各业之中的基于知识社会下一代创新(创新2.0)的城市信息化高级形态,实现信息化、工业化与城镇化深度融合,有助于缓解“大城市病”,提高城镇化质量,实现精细化和动态管理,并提升城市管理成效和改善市民生活质量。关于智慧城市的具体定义比较广泛,目前在国际上被广泛认同的定义是,智慧城市是新一代信息技术支撑、知识社会下一代创新(创新2.0)环境下的城市形态,强调智慧城市不仅仅是物联网、云计算等新一代信息技术的应用,更重要的是通过面向知识社会的创新2.0的方法论应用,构建用户创新、开放创新、大众创新、协同创新为特征的城市可持续创新生态。
基于深度学习的手语识别综述
专知会员服务
45+阅读 · 2020年5月18日
专知会员服务
216+阅读 · 2020年5月6日
基于深度学习的多标签生成研究进展
专知会员服务
140+阅读 · 2020年4月25日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
 图像内容自动描述技术综述
专知会员服务
84+阅读 · 2019年11月17日
深度学习视频中多目标跟踪:论文综述
专知会员服务
90+阅读 · 2019年10月13日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
【综述】视频摘要最新综述文章,附45页综述全文下载
专知会员服务
33+阅读 · 2019年9月20日
竞赛方案|VideoNet视频内容识别挑战赛
极市平台
14+阅读 · 2019年9月8日
爱奇艺视频人物识别技术及应用
QCon
7+阅读 · 2019年4月8日
深度学习在金融文本情感分类中的应用
AI前线
36+阅读 · 2019年1月12日
基于视频的目标检测的发展【附PPT与视频资料】
人工智能前沿讲习班
19+阅读 · 2018年12月14日
AI综述专栏 | 步态识别的深度学习综述
人工智能前沿讲习班
29+阅读 · 2018年6月27日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
视频行为识别年度进展
深度学习大讲堂
34+阅读 · 2017年6月12日
SlowFast Networks for Video Recognition
Arxiv
4+阅读 · 2019年4月18日
Arxiv
8+阅读 · 2019年3月28日
Few-shot Adaptive Faster R-CNN
Arxiv
3+阅读 · 2019年3月22日
Arxiv
30+阅读 · 2019年3月13日
Arxiv
6+阅读 · 2018年2月8日
Arxiv
7+阅读 · 2018年1月24日
VIP会员
相关VIP内容
基于深度学习的手语识别综述
专知会员服务
45+阅读 · 2020年5月18日
专知会员服务
216+阅读 · 2020年5月6日
基于深度学习的多标签生成研究进展
专知会员服务
140+阅读 · 2020年4月25日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
 图像内容自动描述技术综述
专知会员服务
84+阅读 · 2019年11月17日
深度学习视频中多目标跟踪:论文综述
专知会员服务
90+阅读 · 2019年10月13日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
【综述】视频摘要最新综述文章,附45页综述全文下载
专知会员服务
33+阅读 · 2019年9月20日
相关资讯
竞赛方案|VideoNet视频内容识别挑战赛
极市平台
14+阅读 · 2019年9月8日
爱奇艺视频人物识别技术及应用
QCon
7+阅读 · 2019年4月8日
深度学习在金融文本情感分类中的应用
AI前线
36+阅读 · 2019年1月12日
基于视频的目标检测的发展【附PPT与视频资料】
人工智能前沿讲习班
19+阅读 · 2018年12月14日
AI综述专栏 | 步态识别的深度学习综述
人工智能前沿讲习班
29+阅读 · 2018年6月27日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
视频行为识别年度进展
深度学习大讲堂
34+阅读 · 2017年6月12日
相关论文
SlowFast Networks for Video Recognition
Arxiv
4+阅读 · 2019年4月18日
Arxiv
8+阅读 · 2019年3月28日
Few-shot Adaptive Faster R-CNN
Arxiv
3+阅读 · 2019年3月22日
Arxiv
30+阅读 · 2019年3月13日
Arxiv
6+阅读 · 2018年2月8日
Arxiv
7+阅读 · 2018年1月24日
Top
微信扫码咨询专知VIP会员