Advertisers commonly need multiple versions of the same advertisement (ad) at varying durations for a single campaign. The traditional approach involves manually selecting and re-editing shots from longer video ads to create shorter versions, which is labor-intensive and time-consuming. In this paper, we introduce a framework for automated video ad clipping using video summarization techniques. We are the first to frame video clipping as a shot selection problem, tailored specifically for advertising. Unlike existing general video summarization methods that primarily focus on visual content, our approach emphasizes the critical role of audio in advertising. To achieve this, we develop a two-stream audio-visual fusion model that predicts the importance of video frames, where importance is defined as the likelihood of a frame being selected in the firm-produced short ad. To address the lack of ad-specific datasets, we present AdSum204, a novel dataset comprising 102 pairs of 30-second and 15-second ads from real advertising campaigns. Extensive experiments demonstrate that our model outperforms state-of-the-art methods across various metrics, including Average Precision, Area Under Curve, Spearman, and Kendall. The dataset and code are available at https://github.com/ostadabbas/AdSum204.


翻译:广告商通常需要在同一广告活动中制作不同时长的多个版本广告。传统方法依赖人工从较长视频广告中选取镜头并重新剪辑以生成较短版本,这一过程耗时费力。本文提出一种基于视频摘要技术的自动化视频广告剪辑框架。我们首次将视频剪辑问题构建为针对广告场景的镜头选择任务。与现有主要关注视觉内容的通用视频摘要方法不同,我们的方法强调音频在广告中的关键作用。为此,我们开发了一种双流视听融合模型,用于预测视频帧的重要性——这里的重要性定义为该帧被广告公司制作的短视频广告选用的概率。针对缺乏广告专用数据集的问题,我们提出了AdSum204数据集,该数据集包含来自真实广告活动的102对30秒与15秒广告视频。大量实验表明,我们的模型在平均精度、曲线下面积、斯皮尔曼相关系数和肯德尔相关系数等多个指标上均优于现有最优方法。数据集与代码已公开于https://github.com/ostadabbas/AdSum204。

0
下载
关闭预览

相关内容

国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员