Over the past few years, various tasks involving videos such as classification, description, summarization and question answering have received a lot of attention. Current models for these tasks compute an encoding of the video by treating it as a sequence of images and going over every image in the sequence. However, for longer videos this is very time consuming. In this paper, we focus on the task of video classification and aim to reduce the computational time by using the idea of distillation. Specifically, we first train a teacher network which looks at all the frames in a video and computes a representation for the video. We then train a student network whose objective is to process only a small fraction of the frames in the video and still produce a representation which is very close to the representation computed by the teacher network. This smaller student network involving fewer computations can then be employed at inference time for video classification. We experiment with the YouTube-8M dataset and show that the proposed student network can reduce the inference time by upto 30% with a very small drop in the performance


翻译:在过去几年里,涉及诸如分类、描述、概括和答题回答等视频的不同任务引起了人们的极大关注。这些任务的现有模型通过将视频作为图像序列处理,对视频编码进行计算,将视频的编码作为序列中的每个图像序列进行。然而,对于较长的视频来说,这非常耗时。在本文中,我们侧重于视频分类的任务,目的是利用蒸馏的想法减少计算时间。具体地说,我们首先培训一个教师网络,在视频中查看所有框架,然后为视频计算一个演示。然后,我们培训一个学生网络,其目标只是处理视频框架的一小部分,并且仍然制作一个非常接近教师网络所计算的代表性。这个较小的学生网络在视频分类的推论时间里可以使用较少的计算。我们用YouTube-8M数据集进行实验,并表明,拟议的学生网络可以将推算时间减少30%,其表现的下降幅度很小。

8
下载
关闭预览

相关内容

【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
46+阅读 · 2020年7月4日
【ICLR 2019】双曲注意力网络,Hyperbolic  Attention Network
专知会员服务
82+阅读 · 2020年6月21日
因果图,Causal Graphs,52页ppt
专知会员服务
238+阅读 · 2020年4月19日
专知会员服务
59+阅读 · 2020年3月19日
TensorFlow 2.0 学习资源汇总
专知会员服务
66+阅读 · 2019年10月9日
内涵网络嵌入:Content-rich Network Embedding
我爱读PAMI
4+阅读 · 2019年11月5日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
15+阅读 · 2018年12月24日
计算机视觉领域顶会CVPR 2018 接受论文列表
【推荐】图像分类必读开创性论文汇总
机器学习研究会
14+阅读 · 2017年8月15日
Arxiv
5+阅读 · 2018年5月16日
Arxiv
5+阅读 · 2018年3月30日
VIP会员
Top
微信扫码咨询专知VIP会员