With the growth of computer vision based applications and services, an explosive amount of images have been uploaded to cloud servers which host such computer vision algorithms, usually in the form of deep learning models. JPEG has been used as the {\em de facto} compression and encapsulation method before one uploads the images, due to its wide adaptation. However, standard JPEG configuration does not always perform well for compressing images that are to be processed by a deep learning model, e.g., the standard quality level of JPEG leads to 50\% of size overhead (compared with the best quality level selection) on ImageNet under the same inference accuracy in popular computer vision models including InceptionNet, ResNet, etc. Knowing this, designing a better JPEG configuration for online computer vision services is still extremely challenging: 1) Cloud-based computer vision models are usually a black box to end-users; thus it is difficult to design JPEG configuration without knowing their model structures. 2) JPEG configuration has to change when different users use it. In this paper, we propose a reinforcement learning based JPEG configuration framework. In particular, we design an agent that adaptively chooses the compression level according to the input image's features and backend deep learning models. Then we train the agent in a reinforcement learning way to adapt it for different deep learning cloud services that act as the {\em interactive training environment} and feeding a reward with comprehensive consideration of accuracy and data size. In our real-world evaluation on Amazon Rekognition, Face++ and Baidu Vision, our approach can reduce the size of images by 1/2 -- 1/3 while the overall classification accuracy only decreases slightly.


翻译:随着基于计算机视觉的应用和服务的增长,大量图像被上传到云端服务器,这些服务器通常以深层学习模型的形式,主办这种计算机视觉算法。JPEG在上传图像之前被用作压缩和封装方法,因为其适应性很广。然而,标准的JPEG配置在压缩图像方面并非总能很好地使用深层学习模型处理图像,例如,JPEG的标准质量水平导致图像网上50英寸大小管理(与最佳质量等级选择相比)在图像网上以同样的方式进行互动式计算机视觉模型的精确度,包括Inception/3Net、ResNet等。了解这一点,为在线计算机视觉服务设计更好的JPEG配置仍然极具挑战性:1)基于云层的计算机视觉模型通常是最终用户的黑盒;因此很难在不了解模型结构的情况下设计JPEG配置。 2 当不同的用户使用它时,JPEG配置必须改变。在本文中,我们建议一个基于JPEG配置框架的强化学习。特别是,我们设计一个代理机构,在进行深度精度2的精确度2级的精确度上,在学习深度图像上,在学习深度的深度的不断学习,然后学习,在深度图像上,在深度上,我们学习一个深度的精度上,在深度的精度上,在深度的精度上,在深度的精度上,在深度的精度上,在深度的精度上,我们的精度上,我们设计一个精度上,在学习,在深度的精度。

0
下载
关闭预览

相关内容

专知会员服务
109+阅读 · 2020年3月12日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
30+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
166+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
76+阅读 · 2019年10月10日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
24+阅读 · 2019年5月18日
Deep Compression/Acceleration:模型压缩加速论文汇总
极市平台
13+阅读 · 2019年5月15日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
15+阅读 · 2018年12月24日
语义分割+视频分割开源代码集合
极市平台
35+阅读 · 2018年3月5日
【推荐】用Python/OpenCV实现增强现实
机器学习研究会
14+阅读 · 2017年11月16日
【推荐】视频目标分割基础
机器学习研究会
9+阅读 · 2017年9月19日
【推荐】图像分类必读开创性论文汇总
机器学习研究会
14+阅读 · 2017年8月15日
Arxiv
33+阅读 · 2019年11月7日
Generative Adversarial Networks: A Survey and Taxonomy
Arxiv
6+阅读 · 2018年2月8日
VIP会员
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
24+阅读 · 2019年5月18日
Deep Compression/Acceleration:模型压缩加速论文汇总
极市平台
13+阅读 · 2019年5月15日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
15+阅读 · 2018年12月24日
语义分割+视频分割开源代码集合
极市平台
35+阅读 · 2018年3月5日
【推荐】用Python/OpenCV实现增强现实
机器学习研究会
14+阅读 · 2017年11月16日
【推荐】视频目标分割基础
机器学习研究会
9+阅读 · 2017年9月19日
【推荐】图像分类必读开创性论文汇总
机器学习研究会
14+阅读 · 2017年8月15日
Top
微信扫码咨询专知VIP会员