项目名称: 基于多任务稀疏学习的视频行为理解

项目编号: No.61472420

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 计算机科学学科

项目作者: 原春锋

作者单位: 中国科学院自动化研究所

项目金额: 81万元

中文摘要: 现有的视频行为理解主要集中在行为分类和识别上,对于行为检测特别是预测的研究相对较少。本项目将视频行为理解的研究从单纯的行为识别扩展到对行为进行识别的同时实现检测和预测;从分割好的仅包含一种行为的短视频提升到包含多人多种行为的复杂长视频的研究;从离线的分类处理到在线的检测预测处理;从理论研究为主要目标发展到越来越关注在实际中的应用价值。主要研究内容包括:(1)底层特征提取,拟提出基于有向运动显著性区域的描述子和基于图的热核结构描述子;(2)中层视频行为表示,拟提出一种基于非参数贝叶斯模型的多任务稀疏学习方法进行多特征联合视频表示;(3)高层行为检测、预测,拟提出一种基于随机森林和Hough投票的检测策略,和一种基于结构化输出支持向量机的行为预测框架。本项目立足于前沿,将在行为理解领域做出一系列国际领先工作,并为视频检索、视觉智能监控等领域提供相关理论和关键技术。

中文关键词: 视频分析;稀疏表示;特征提取;计算机视觉

英文摘要: Current human action understanding mainly focuses on action classification and recognition. There is less research on action detection and especially on action prediction. This project reforms the study of human action understanding from simple recognition to detection and prediction, from handling a segmented short video containing only one action class to the complex long video containing multiple persons and multiple action classes, from offline classification processing to online detection and prediction, and from theoretical research as the main objective to paying more attention on the practical application value. The main research content includes: (1) for low-level feature extraction, propose a oriented motion salient region descriptor and a graph based heat kernel structural descriptor; (2) for middle-level video action representation, propose a non-parametric Bayesian based multi-task sparse learning model for multiple features joint representation; (3) for high-level action detection and prediction, develop a random forest and hough voting based action detection strategy and a structured output SVM (SOSVM) based action prediction framework. The project stands on the academic frontier and will make a series of advanced work on human action understanding to provide the related theories and key techniques for video retrieval, visual intelligent surveillance and other areas.

英文关键词: video analysis;sparse representation;feature extraction;computer vision

成为VIP会员查看完整内容
0

相关内容

【CVPR2022】高分辨率和多样化的视频-文本预训练模型
专知会员服务
9+阅读 · 2022年3月6日
「元学习」最新DSAA2021-Tutorial,附视频与83页ppt
专知会员服务
29+阅读 · 2021年10月20日
专知会员服务
120+阅读 · 2021年6月19日
专知会员服务
7+阅读 · 2021年6月19日
【CVPR2021】群体协同学习在共显著目标检测中的应用
专知会员服务
17+阅读 · 2021年4月6日
「元学习」最新AAAI2021-Tutorial,附视频与240页ppt
专知会员服务
114+阅读 · 2021年2月7日
【NeurIPS 2020】视觉注意力神经编码
专知会员服务
40+阅读 · 2020年10月4日
【泡泡点云时空】FlowNet3D:学习三维点云中的场景流
泡泡机器人SLAM
41+阅读 · 2019年5月19日
【紫冬分享】基于人体骨架的行为识别
中国科学院自动化研究所
20+阅读 · 2019年1月18日
视频中的多目标跟踪【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2018年11月29日
独家 | 光流与行为识别的结合研究
AI科技评论
12+阅读 · 2017年12月29日
视频行为识别年度进展
深度学习大讲堂
34+阅读 · 2017年6月12日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
16+阅读 · 2021年3月2日
小贴士
相关VIP内容
【CVPR2022】高分辨率和多样化的视频-文本预训练模型
专知会员服务
9+阅读 · 2022年3月6日
「元学习」最新DSAA2021-Tutorial,附视频与83页ppt
专知会员服务
29+阅读 · 2021年10月20日
专知会员服务
120+阅读 · 2021年6月19日
专知会员服务
7+阅读 · 2021年6月19日
【CVPR2021】群体协同学习在共显著目标检测中的应用
专知会员服务
17+阅读 · 2021年4月6日
「元学习」最新AAAI2021-Tutorial,附视频与240页ppt
专知会员服务
114+阅读 · 2021年2月7日
【NeurIPS 2020】视觉注意力神经编码
专知会员服务
40+阅读 · 2020年10月4日
相关资讯
【泡泡点云时空】FlowNet3D:学习三维点云中的场景流
泡泡机器人SLAM
41+阅读 · 2019年5月19日
【紫冬分享】基于人体骨架的行为识别
中国科学院自动化研究所
20+阅读 · 2019年1月18日
视频中的多目标跟踪【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2018年11月29日
独家 | 光流与行为识别的结合研究
AI科技评论
12+阅读 · 2017年12月29日
视频行为识别年度进展
深度学习大讲堂
34+阅读 · 2017年6月12日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员