7 Papers & Radios | 华为配置管理研究获SIGCOMM 2022最佳论文；用即插即用模块改进ViT和卷积模型

会员服务 ·

7 Papers & Radios | 华为配置管理研究获SIGCOMM 2022最佳论文；用即插即用模块改进ViT和卷积模型

2022 年 9 月 4 日 机器之心

机器之心 & ArXiv Weekly Radiostation

参与：杜伟、楚航、罗若天

本周主要论文包括MSU 联合 MIT-IBM 提出首个黑箱防御框架；CMU 提出首个快速知识蒸馏的视觉框架等研究。

How to Robustify Black-Box ML Models? A Zeroth-Order Optimization Perspective
Language Models as Knowledge Embeddings
HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions
Practical Lossless Federated Singular Vector Decomposition over Billion-Scale Data
No Free Lunch Theorem for Security and Utility in Federated Learning
Software-defined network assimilation: bridging the last mile towards centralized network configuration management with NAssim
A Fast Knowledge Distillation Framework for Visual Recognition
ArXiv Weekly Radiostation：NLP、CV、ML 更多精选论文（附音频）

论文 1：How to Robustify Black-Box ML Models? A Zeroth-Order Optimization Perspective

作者：张益萌等
论文地址：https://openreview.net/forum?id=W9G_ImpHlQd

摘要： 这是密歇根州立大学 (Michigan State University) 和 MIT-IBM AI 实验室的一篇关于黑箱防御工作的文章，本文被 ICLR 2022 接收为 spotlight paper，代码和模型均已开源。

本文主要研究了在只使用目标模型的输入和输出的情况下，如何进行黑箱防御。为了解决黑箱防御这个难题，本文将降噪平滑与零阶优化结合起来，提出了有效的且可扩展的 ZO-AE-DS 黑箱防御框架，这个框架有效地减少了零阶梯度估计的方差，进而缩减了零阶优化与一阶优化性能上的差距。

推荐：MSU 联合 MIT-IBM 提出首个黑箱防御框架。

论文 2：Language Models as Knowledge Embeddings

作者：Xintao Wang 等
论文地址：https://www.ijcai.org/proceedings/2022/0318.pdf

摘要： 本文提出了一个将语言模型用作知识嵌入的方法 LMKE（Language Models as Knowledge Embeddings），同时利用结构信息和文本信息，并首次将基于文本的知识嵌入学习建模在对比学习框架下，从而在提升长尾实体表示的同时解决了现有基于文本的知识嵌入方法在表现、效率等方面的不足。相关研究成果现已被 IJCAI 2022 录用。

LMKE 的模型结构（用于三元组分类）

推荐： 将语言模型用作知识嵌入：链接预测、三元组分类全部 SOTA，超越基于结构的传统方法。

论文 3：HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

作者：Yongming Rao 等
论文地址：https://arxiv.org/abs/2207.14284

摘要： 视觉 Transformer 的最新进展表明，在基于点积自注意力的新空间建模机制驱动的各种任务中取得了巨大成功。在本文中，作者证明了视觉 Transformer 背后的关键成分，即输入自适应、长程和高阶空间交互，也可以通过基于卷积的框架有效实现。作者提出了递归门卷积

，它用门卷积和递归设计进行高阶空间交互。新操作具有高度灵活性和可定制性，与卷积的各种变体兼容，并将自注意力中的二阶交互扩展到任意阶，而不引入显著的额外计算。

思路展示。

推荐： 用即插即用模块来改进各种视觉 Transformer 和基于卷积的模型。

论文 4：Practical Lossless Federated Singular Vector Decomposition over Billion-Scale Data

作者：Di Chai 等
论文地址：https://dl.acm.org/doi/abs/10.1145/3534678.3539402

摘要： 文章提出了基于随机掩码的奇异值分解方案，应用于多方生物数据分析、多方金融数据建模等场景，在 SVD 任务中，该方案的效率比同态加密提高 10000 倍，误差比差分隐私方案小 10 个数量级，同时提供了安全性分析和实验验证。

FedSVD 的详细工作流。

推荐： 10 亿规模数据上的无损联邦奇异值分解。

论文 5：No Free Lunch Theorem for Security and Utility in Federated Learning

作者：Xiaojin Zhang 等
论文地址：https://arxiv.org/pdf/2203.05816.pdf

摘要： 从信息论的角度为联邦学习中隐私泄漏和效用损失的分析提供了一个通用的框架，量化了隐私和效用之间的约束关系，揭示了隐私效用的无免费午餐场景，该论文阐述的框架及分析可以为设计可信联邦学习算法提供有效的指导。

基于贝叶斯推理攻击和隐私效用权衡的 SFL 框架概览。

推荐： 联邦学习中隐私与模型性能没有免费午餐定理。

论文 6：Software-defined network assimilation: bridging the last mile towards centralized network configuration management with NAssim

作者：Huangxun Chen 等
论文地址：https://dl.acm.org/doi/10.1145/3544216.3544244

摘要： 面向网络基础设施需要吸纳新设备的长期而持续的需求，高效准确获取设备原生配置模型和网络统一配置管理模型的映射关系是一个核心挑战。在 8 月 22 日 - 26 日举办的第 36 届 SIGCOMM 2022 会议上，华为的研究者针对这一难题提出了崭新的思路, 受生物学里的同化作用 Assimilation 的启发，首次提出了 SNA （Software-defined Network Assimilation）的概念。

研究者推出了助力网络配置管理最后一公里的辅助框架 NAssim，把一个现有网络 “消化、理解、吸收” 新设备的过程尽可能进行了自动化，并提出用网络配置语义模型 NetBERT 直接 “读懂” 配置说明书，把运维工程师从繁琐易出错的工作中解放出来，大幅提升网络运维的效率。目前该工作正在华为数通产品线进行落地试点。

设计思路。

推荐： 理论用于实践，华为配置管理研究获 SIGCOMM 2022 最佳论文奖。

论文 7：A Fast Knowledge Distillation Framework for Visual Recognition

作者：Zhiqiang Shen、Eric Xing
论文地址：https://arxiv.org/pdf/2112.01528.pdf

摘要： 这是一篇来自卡耐基梅隆大学等单位 ECCV 2022 的一篇关于快速知识蒸馏的文章，用基本的训练参数配置就可以把 ResNet-50 在 ImageNet-1K 从头开始 (from scratch) 训练到 80.1% (不使用 mixup，cutmix 等数据增强)，训练速度（尤其是数据读取开销）相比传统分类框架节省 16% 以上，比之前 SOTA 算法快 30% 以上，是目前精度和速度双双最优的知识蒸馏策略之一，代码和模型已全部开源！

FKD 算法框架。

推荐： CMU 提出首个快速知识蒸馏的视觉框架：ResNet50 80.1% 精度，训练加速 30%。

ArXiv Weekly Radiostation

机器之心联合由楚航、罗若天发起的ArXiv Weekly Radiostation，在 7 Papers 的基础上，精选本周更多重要论文，包括NLP、CV、ML领域各10篇精选，并提供音频形式的论文摘要简介，详情如下：

本周 10 篇 NLP 精选论文是：

1. A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future Directions. (from Jian Sun)

2. Searching for Structure in Unfalsifiable Claims. (from Serge Belongie)

3. Debiasing Word Embeddings with Nonlinear Geometry. (from Huan Liu)

4. Incorporating Task-specific Concept Knowledge into Script Learning. (from ChengXiang Zhai)

5. StoryTrans: Non-Parallel Story Author-Style Transfer with Discourse Representations and Content Enhancing. (from Minlie Huang)

6. Streaming Intended Query Detection using E2E Modeling for Continued Conversation. (from Tara N. Sainath)

7. Turn-Taking Prediction for Natural Conversational Speech. (from Tara N. Sainath)

8. Bayesian Neural Network Language Modeling for Speech Recognition. (from Xunying Liu)

9. Optimizing Bi-Encoder for Named Entity Recognition via Contrastive Learning. (from Jianfeng Gao)

10. AutoQGS: Auto-Prompt for Low-Resource Knowledge-based Question Generation from SPARQL. (from Xiaodong He)

本周 10 篇 CV 精选论文是：

1. Synthetic Latent Fingerprint Generator. (from Anil K. Jain)

2. CounTR: Transformer-based Generalised Visual Counting. (from Andrew Zisserman)

3. Visual Prompting via Image Inpainting. (from Trevor Darrell, Alexei A. Efros)

4. Uncertainty-Induced Transferability Representation for Source-Free Unsupervised Domain Adaptation. (from Liang Chen, Yang Liu)

5. Grounded Affordance from Exocentric View. (from Dacheng Tao)

6. Learning Continuous Implicit Representation for Near-Periodic Patterns. (from Martial Hebert, Srinivasa G. Narasimhan)

7. Compound Figure Separation of Biomedical Images: Mining Large Datasets for Self-supervised Learning. (from Agnes B. Fogo)

8. Probing Contextual Diversity for Dense Out-of-Distribution Detection. (from Thomas Brox)

9. GaitFi: Robust Device-Free Human Identification via WiFi and Vision Multimodal Learning. (from Lihua Xie)

10. Towards In-distribution Compatibility in Out-of-distribution Detection. (from Deng Cai, Xiaofei He, Wei Liu)

本周 10 篇 ML 精选论文是：

1. A Self-supervised Riemannian GNN with Time Varying Curvature for Temporal Graph Learning. (from Philip S. Yu)

2. Learning with Few Labeled Nodes via Augmented Graph Self-Training. (from Huan Liu)

3. NeurIPS'22 Cross-Domain MetaDL competition: Design and baseline results. (from Isabelle Guyon)

4. RUAD: unsupervised anomaly detection in HPC systems. (from Luca Benini)

5. Autoinverse: Uncertainty Aware Inversion of Neural Networks. (from Hans-Peter Seidel)

6. Dynamic Regret of Online Markov Decision Processes. (from Zhi-Hua Zhou)

7. Super-model ecosystem: A domain-adaptation perspective. (from Dacheng Tao)

8. Trading Off Privacy, Utility and Efficiency in Federated Learning. (from Kai Chen)

9. Overparameterized (robust) models from computational constraints. (from Somesh Jha)

10. Fundamentals of Task-Agnostic Data Valuation. (from Ramesh Raskar)

转载请联系本公众号获得授权

投稿或寻求报道：content@jiqizhixin.com

登录查看更多

相关内容

即插即用

关注 0

NeurIPS 2022杰出论文奖项公布！AlexNet获时间检验奖

专知会员服务

15+阅读 · 2022年11月22日

KDD 2022 | GraphMAE:自监督掩码图自编码器

专知会员服务

20+阅读 · 2022年7月14日

AAAI22奖项公布，9000投稿选出唯一杰出论文，中科院自动化所获Distinguished论文奖

专知会员服务

24+阅读 · 2022年2月25日

SIGMOD 2021最佳论文奖出炉，MIT等获数据管理最佳论文，苹果获得工业最佳论文

专知会员服务

19+阅读 · 2021年6月24日

【SIGIR2021阿里达摩院】基于门控和专注邻居聚合器的关系学习的少样本知识图谱补全

专知会员服务

30+阅读 · 2021年4月29日

【WWW 2021】论解耦图卷积网络和标签传播的等价性

专知会员服务

28+阅读 · 2021年3月17日

华为等发布《视觉Transformer转换器》综述论文，21页pdf

专知会员服务

86+阅读 · 2020年12月25日

【KDD2019|讲座推荐】零阶优化及其在数据挖掘和机器学习中对抗鲁棒性的应用研究进展：Recent Progress in Zeroth Order Optimization and Its Applications to Adversarial Robustness in Data Mining and Machine Learning

专知会员服务

16+阅读 · 2019年12月6日

【AAAI2020论文】小样本网络压缩，Few Shot Network Compression via Cross Distillation (附pdf）

专知会员服务

26+阅读 · 2019年11月23日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

7 Papers & Radios | Stable Diffusion采样速度翻倍；MIT解决神经网络百年难题

机器之心

2+阅读 · 2022年11月20日

7 Papers & Radios | ECCV 2022最佳论文；Transformer在试错中自主改进

机器之心

0+阅读 · 2022年10月30日

7 Papers & Radios | Bengio等用GFlowNets统一生成模型；首个黑箱防御框架

机器之心

0+阅读 · 2022年9月11日

ICLR 2022 Spotlight | MSU联合MIT-IBM提出首个黑箱防御框架

机器之心

0+阅读 · 2022年9月7日

理论用于实践！华为配置管理研究获SIGCOMM 2022最佳论文奖

机器之心

0+阅读 · 2022年8月31日

7 Papers & Radios | 新型Transformer架构解决多智能体强化学习问题；ICRA 2022最佳论文出炉

机器之心

1+阅读 · 2022年6月5日

CVPR 2022 | ViT版的Slimming来了，原作者团队打造，参数少，搜索更高效

极市平台

0+阅读 · 2022年5月1日

7 Papers & Radios | 华人团队图像分类ViR超越ViT；Transformer逆向工程为数学框架

机器之心

2+阅读 · 2022年1月2日

7 Papers & Radios | CoRL 2021奖项；何恺明新论文让计算机视觉通向大模型

机器之心

0+阅读 · 2021年11月14日

异常检测论文大列表：方法、应用、综述

专知

126+阅读 · 2019年7月15日

网络喷泉码的基础理论与设计方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于稀疏表示的在线视觉跟踪

国家自然科学基金

0+阅读 · 2014年12月31日

基于Markov博弈的计算机网络对抗行动策略分析与建模研究

国家自然科学基金

17+阅读 · 2013年12月31日

随机多重分形信号的广义分数阶奇异性谱分析理论及应用

国家自然科学基金

0+阅读 · 2013年12月31日

广义稳健中国剩余定理及其在时空欠采样多目标参数估计中的应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

分布式超紧GPS/SINS组合架构下的信号处理方法和完好性评估机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

实时安全关键系统的建模、仿真与验证

国家自然科学基金

1+阅读 · 2012年12月31日

基于稀疏采样的全相位互素谱分析理论及应用

国家自然科学基金

0+阅读 · 2012年12月31日

基于网络编码的大规模无线网络容量分析

国家自然科学基金

1+阅读 · 2009年12月31日

半自治分布式紧凑供电系统的故障诊断理论及应用

国家自然科学基金

0+阅读 · 2009年12月31日

Sparse2Dense: Learning to Densify 3D Features for 3D Object Detection

Arxiv

0+阅读 · 2022年11月23日

Predicate Invention for Bilevel Planning

Arxiv

0+阅读 · 2022年11月23日

Augmented Physics-Informed Neural Networks (APINNs): A gating network-based soft domain decomposition methodology

Arxiv

0+阅读 · 2022年11月23日

Real-time Model Predictive Control and System Identification Using Differentiable Physics Simulation

Arxiv

0+阅读 · 2022年11月23日

Utopia: Efficient Address Translation using Hybrid Virtual-to-Physical Address Mapping

Arxiv

0+阅读 · 2022年11月22日

A Survey of Knowledge-Enhanced Pre-trained Language Models

Arxiv

18+阅读 · 2022年11月17日

A Large-Scale Study on Unsupervised Spatiotemporal Representation Learning

Arxiv

11+阅读 · 2021年4月29日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

Making Pre-trained Language Models Better Few-shot Learners

Arxiv

14+阅读 · 2020年12月31日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

VIP会员