项目名称: 面向智能视频监控系统中目标理解的长时程深度学习模型研究

项目编号: No.61471206

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 无线电电子学、电信技术

项目作者: 孙宁

作者单位: 南京邮电大学

项目金额: 81万元

中文摘要: 基于视频的目标理解,是对视频中目标属性和目标行为在语义层次上的描述,是视频监控系统智能化应用的重要体现。由于采集视角,目标姿态,光照条件等方面差异,加上之前目标检测和目标跟踪处理带入的误差等因素的影响,基于短时程图像序列的分析算法很难在实际条件下进行准确和稳定的目标理解。针对上述问题,本项目以深度学习理论为基础,从长时程图像序列中目标的时空相关特性出发,将卷积神经网络(CNN)和深度置信网络(DBN)进行融合,建立长时程深度混合神经网络(LDHNN)模型,利用CNN实现对三维图像序列数据的特征化和向量化,堆叠DBN来加深网络的层次,提升网络对目标长时程时空特征的学习能力。基于逐网络逐层的思想,推导LDHNN的训练算法,并利用多GPU并行运算来大幅加速训练过程,实现基于LDHNN的目标理解功能,为研究面向长时程图像序列的深度学习模型,提升现有视频监控系统的智能化应用探索一条有效的技术途径。

中文关键词: 视频语义理解;深度学习;长时程;深度混合神经网络;目标识别

英文摘要: Object understanding based on video, which is the semantic description of target attribute and behavior, and is an important embodiment of intelligent video surveillance system application. As the impact of video resolution, viewing angle, target poses and illumination dynamic, as well as the error of previous target detection and target tracking, the short-term image sequences based algorithm is unable to understand the object precisely and stably. In this project, a Long-term Deep Hybrid Neural Networks (LDHNN) model will be built with Convolution Neural Networks (CNN) and the Deep Belief Networks (DBN) based on the theory of deep learning and the principal of target spatial-temporal correlation in long-term image sequences. In the model of LDHNN, 3D image sequences are mapped to 1D feature vectors by CNN, and the stacked DBN deepen the level of entire networks. The network-wise and layer-wise training procedure of LDHNN can be accelerated obviously by parallel computing using multiple GPUs. It will provide the theoretical and technological support for long-term object understanding in video surveillance system.

英文关键词: video understanding;deep learning;long-term;deep hybrid neural network;object recognition

成为VIP会员查看完整内容
0

相关内容

TPAMI 2021|VideoDG:首个视频领域泛化模型
专知会员服务
19+阅读 · 2021年12月31日
智能视频监控关键技术:行人再识别研究综述
专知会员服务
36+阅读 · 2021年12月30日
专知会员服务
18+阅读 · 2021年10月9日
专知会员服务
89+阅读 · 2021年8月29日
基于深度学习的视频目标检测综述
专知会员服务
78+阅读 · 2021年5月19日
视频分析中的人工智能 (AI)白皮书,16页pdf
专知会员服务
62+阅读 · 2021年5月6日
专知会员服务
62+阅读 · 2021年5月3日
专知会员服务
116+阅读 · 2021年4月29日
面向自动驾驶的边缘计算技术研究综述
专知
4+阅读 · 2021年5月3日
基于深度学习的小目标检测方法综述
专知
1+阅读 · 2021年4月29日
基于深度学习的视频目标检测综述
极市平台
15+阅读 · 2019年7月19日
视频大脑:视频内容理解的技术与应用
AI前线
13+阅读 · 2019年4月18日
综述 | 近5年基于深度学习的目标检测算法
计算机视觉life
36+阅读 · 2019年4月18日
基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】
人工智能前沿讲习班
12+阅读 · 2018年12月25日
基于视频的目标检测的发展【附PPT与视频资料】
人工智能前沿讲习班
19+阅读 · 2018年12月14日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
27+阅读 · 2018年4月12日
小贴士
相关VIP内容
TPAMI 2021|VideoDG:首个视频领域泛化模型
专知会员服务
19+阅读 · 2021年12月31日
智能视频监控关键技术:行人再识别研究综述
专知会员服务
36+阅读 · 2021年12月30日
专知会员服务
18+阅读 · 2021年10月9日
专知会员服务
89+阅读 · 2021年8月29日
基于深度学习的视频目标检测综述
专知会员服务
78+阅读 · 2021年5月19日
视频分析中的人工智能 (AI)白皮书,16页pdf
专知会员服务
62+阅读 · 2021年5月6日
专知会员服务
62+阅读 · 2021年5月3日
专知会员服务
116+阅读 · 2021年4月29日
相关资讯
面向自动驾驶的边缘计算技术研究综述
专知
4+阅读 · 2021年5月3日
基于深度学习的小目标检测方法综述
专知
1+阅读 · 2021年4月29日
基于深度学习的视频目标检测综述
极市平台
15+阅读 · 2019年7月19日
视频大脑:视频内容理解的技术与应用
AI前线
13+阅读 · 2019年4月18日
综述 | 近5年基于深度学习的目标检测算法
计算机视觉life
36+阅读 · 2019年4月18日
基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】
人工智能前沿讲习班
12+阅读 · 2018年12月25日
基于视频的目标检测的发展【附PPT与视频资料】
人工智能前沿讲习班
19+阅读 · 2018年12月14日
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员