计算机视觉/图像处理每日论文速递[12.06]

同步公众号(arXiv每日论文速递),欢迎关注,感谢支持哦~


[检测分类相关]:
【1】 A Document Skew Detection Method Using Fast Hough Transform
一种基于快速Hough变换的文档倾斜检测方法
作者: Pavel Bezmaternykh, Dmitry Nikolaev
链接:arxiv.org/abs/1912.0250

【2】 Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Training Sample Selection
通过自适应训练样本选择弥合基于锚点和无锚点检测之间的差距
作者: Shifeng Zhang, Stan Z. Li
链接:arxiv.org/abs/1912.0242

【3】 Multiple Anchor Learning for Visual Object Detection
用于视觉目标检测的多锚点学习
作者: Wei Ke, Dong Huang
链接:arxiv.org/abs/1912.0225

【4】 Let's Get Dirty: GAN Based Data Augmentation for Soiling and Adverse Weather Classification in Autonomous
Driving
让我们得到Dirty:基于GAN的数据增强,用于自主驾驶中的污垢和不利天气分类
作者: Michal Uricar, Senthil Yogamani
链接:arxiv.org/abs/1912.0224

【5】 Towards Robust Image Classification Using Sequential Attention Models
基于顺序注意模型的鲁棒图像分类
作者: Daniel Zoran, Pushmeet Kohl
链接:arxiv.org/abs/1912.0218

[分割/语义相关]:
【1】 PolyTransform: Deep Polygon Transformer for Instance Segmentation
PolyTransform:用于实例分割的深度多边形转换器
作者: Justin Liang, Raquel Urtasun
链接:arxiv.org/abs/1912.0280

【2】 Deep Learning Based Segmentation Free License Plate Recognition Using Roadway Surveillance Camera Images
基于深度学习的道路监控摄像机图像无分割车牌识别
作者: Alperen Elihos, Yusuf Artan
链接:arxiv.org/abs/1912.0244

【3】 OASIS: One-pass aligned Atlas Set for Image Segmentation
OASIS:用于图像分割的单程对齐地图集
作者: Qikui Zhu, Pingkun Yan
链接:arxiv.org/abs/1912.0241

【4】 Toward Filament Segmentation Using Deep Neural Networks
基于深度神经网络的长丝分割
作者: Azim Ahmadzadeh, Shihao Ji
备注:10 pages, 10 figures, 1 table, accepted in IEEE BigData 2019
链接:arxiv.org/abs/1912.0274

[人脸相关]:
【1】 Revisiting Few-Shot Learning for Facial Expression Recognition
重新审视面部表情识别的几次学习
作者: Anca-Nicoleta Ciubotaru, Maria Gabrani
链接:arxiv.org/abs/1912.0275

【2】 E2-Capsule Neural Networks for Facial Expression Recognition Using AU-Aware Attention
基于AU感知注意的E2胶囊神经网络人脸表情识别
作者: Shan Cao, Gaoyun An
链接:arxiv.org/abs/1912.0249

【3】 Static and Dynamic Fusion for Multi-modal Cross-ethnicity Face Anti-spoofing
静态和动态融合的多模态跨种族人脸反欺骗
作者: Ajian Liu, Stan Z. Li
链接:arxiv.org/abs/1912.0234

[GAN/对抗式/生成式相关]:
【1】 Blind Inpainting of Large-scale Masks of Thin Structures with Adversarial and Reinforcement Learning
基于对抗性和强化学习的大型薄结构掩模盲修补
作者: Hao Chen, Sotirios A. Tsaftaris
链接:arxiv.org/abs/1912.0247

【2】 MetalGAN: Multi-Domain Label-Less Image Synthesis Using cGANs and Meta-Learning
MetalGAN:使用cGAN和元学习的多域无标签图像合成
作者: Tomaso Fontanini, Andrea Prati
链接:arxiv.org/abs/1912.0249

[半/弱/无监督相关]:
【1】 Self-Supervised Learning of Video-Induced Visual Invariances
视频诱导视觉不变性的自监督学习
作者: Michael Tschannen, Mario Lucic
链接:arxiv.org/abs/1912.0278

【2】 Multi-Modal Deep Clustering: Unsupervised Partitioning of Images
多模态深度聚类:图像的无监督分割
作者: Guy Shiran, Daphna Weinshall
链接:arxiv.org/abs/1912.0267

[迁移学习/domain/主动学习/自适应]:
【1】 Spatial-Frequency Domain Nonlocal Total Variation for Image Denoising
用于图像去噪的空频域非局部总变分
作者: Haijuan Hu, Xiequan Fan
链接:arxiv.org/abs/1912.0235

[3D/3D重建等相关]:
【1】 KeyPose: Multi-view 3D Labeling and Keypoint Estimation for Transparent Objects
KeyPose:透明对象的多视图3D标签和关键点估计
作者: Xingyu Liu, Kurt Konolige
链接:arxiv.org/abs/1912.0280

【2】 CLOTH3D: Clothed 3D Humans
CLOTH3D:穿着衣服的3D人类
作者: Hugo Bertiche, Sergio Escalera
链接:arxiv.org/abs/1912.0279

【3】 3D Objectness Estimation via Bottom-up Regret Grouping
基于自下而上后悔分组的3D客观性估计
作者: Zelin Ye, Cewu Lu
链接:arxiv.org/abs/1912.0233

【4】 MORPHOLO C++ Library for glasses-free multi-view stereo vision and streaming of live 3D video
MORPHOLO C+库,用于无眼镜多视图立体视觉和实时3D视频流
作者: Enrique Canessa, Livio Tenze
链接:arxiv.org/abs/1912.0220

[其他视频相关]:
【1】 Zero-Shot Generation of Human-Object Interaction Videos
人物交互视频的Zero-Shot生成
作者: Megha Nawhal, Leonid Sigal
链接:arxiv.org/abs/1912.0240


[其他]:
【1】 Fingerprint Spoof Generalization
指纹欺骗泛化
作者: Tarang Chugh, Anil K. Jain
链接:arxiv.org/abs/1912.0271

【2】 A Novel Hybrid Scheme Using Genetic Algorithms and Deep Learning for the Reconstruction of Portuguese Tile
Panels
一种新的基于遗传算法和深度学习的葡萄牙瓷砖面板重建混合方案
作者: Daniel Rika, Nathan S. Netanyahu
链接:arxiv.org/abs/1912.0270

【3】 Post-Mortem Iris Recognition Resistant to Biological Eye Decay Processes
抗生物眼球腐烂过程的死后虹膜识别
作者: Mateusz Trokielewicz, Piotr Maciejewicz
链接:arxiv.org/abs/1912.0251

【4】 Smartphone Multi-modal Biometric Authentication: Database and Evaluation
智能手机多模式生物特征认证:数据库和评估
作者: Raghavendra Ramachandra, Christoph Busch
链接:arxiv.org/abs/1912.0248

【5】 Revisiting Non Local Sparse Models for Image Restoration
用于图像恢复的非局部稀疏模型的再访问
作者: Bruno Lecouat, Julien Mairal
链接:arxiv.org/abs/1912.0245

【6】 BBN: Bilateral-Branch Network with Cumulative Learning for Long-Tailed Visual Recognition
BBN:用于长尾视觉识别的具有累积学习的双边分支网络
作者: Boyan Zhou, Zhao-Min Chen
备注:Our method won the first place in the iNaturalist 2019 large scale species classification competition, and
our code is open-source and available at \url{this https URL}
链接:arxiv.org/abs/1912.0241

【7】 Ultrafast Photorealistic Style Transfer via Neural Architecture Search
基于神经结构搜索的超快速真实感风格转移
作者: Jie An, Jiebo Luo
链接:arxiv.org/abs/1912.0239

【8】 15 Keypoints Is All You Need
15个关键点即可满足您的需要
作者: Michael Snower, Hans Peter Graf
链接:arxiv.org/abs/1912.0232

【9】 12-in-1: Multi-Task Vision and Language Representation Learning
12合1:多任务愿景和语言表征学习
作者: Jiasen Lu, Stefan Lee
链接:arxiv.org/abs/1912.0231

【10】 Computational Mirrors: Blind Inverse Light Transport by Deep Matrix Factorization
计算反射镜:通过深度矩阵分解实现盲逆光传输
作者: Miika Aittala, Fredo Durand
备注:14 pages, 5 figures, Advances in Neural Information Processing Systems 2019
链接:arxiv.org/abs/1912.0231

【11】 Deep Morphological Hit-or-Miss Transform Neural Network
深形态命中或未命中变换神经网络
作者: Muhammad Aminul Islam, James Keller
链接:arxiv.org/abs/1912.0225

【12】 Compositional Temporal Visual Grounding of Natural Language Event Descriptions
自然语言事件描述的组合时态视觉基础
作者: Jonathan C. Stroud, Olga Russakovsky
链接:arxiv.org/abs/1912.0225

【13】 AugMix: A Simple Data Processing Method to Improve Robustness and Uncertainty
AugMix:一种提高鲁棒性和不确定性的简单数据处理方法
作者: Dan Hendrycks, Balaji Lakshminarayanan
链接:arxiv.org/abs/1912.0278

【14】 Learning to synthesise the ageing brain without longitudinal data
学习在没有纵向数据的情况下合成老化的大脑
作者: Tian Xia, Sotirios A. Tsaftaris
链接:arxiv.org/abs/1912.0262

【15】 Towards Understanding Residual and Dilated Dense Neural Networks via Convolutional Sparse Coding
通过卷积稀疏编码理解残差和膨胀稠密神经网络
作者: Zhiyang Zhang, Shihua Zhang
链接:arxiv.org/abs/1912.0260

【16】 Large-scale Pretraining for Visual Dialog: A Simple State-of-the-Art Baseline
大规模视觉对话前培训:一种简单的最新基线
作者: Vishvak Murahari, Abhishek Das
链接:arxiv.org/abs/1912.0237

【17】 Deep Double Descent: Where Bigger Models and More Data Hurt
深度双下降:更大的模型和更多的数据带来的伤害
作者: Preetum Nakkiran, Ilya Sutskever
链接:arxiv.org/abs/1912.0229

【18】 Angular Visual Hardness
角度视觉硬度
作者: Beidi Chen, Anima Anandkumar
链接:arxiv.org/abs/1912.0227

【19】 Learning from Interventions using Hierarchical Policies for Safe Learning
从使用安全学习分层策略的干预中学习
作者: Jing Bi, Chenliang Xu
备注:Accepted for publication at the Thirty-Fourth AAAI Conference on Artificial Intelligence (AAAI-20)
链接:arxiv.org/abs/1912.0224

机器翻译,仅供参考

编辑于 2019-12-06 13:30