Aura：隐私保护增强语音增强测试集多样性的方法 (Aura: Privacy-preserving Augmentation to Improve Test Set Diversity in Speech Enhancement) - 专知论文

会员服务 ·

0

测试集 · 多样性 · 语音增强 · 特征提取器 · 相关系数 ·

2023 年 4 月 4 日

Aura: Privacy-preserving Augmentation to Improve Test Set Diversity in Speech Enhancement

翻译：Aura：隐私保护增强语音增强测试集多样性的方法

Xavier Gitiaux,Aditya Khant,Ebrahim Beyrami,Chandan Reddy,Jayant Gupchup,Ross Cutler

Noise suppression models running in production environments are commonly trained on publicly available datasets. However, this approach leads to regressions due to the lack of training/testing on representative customer data. Moreover, due to privacy reasons, developers cannot listen to customer content. This `ears-off' situation motivates augmenting existing datasets in a privacy-preserving manner. In this paper, we present Aura, a solution to make existing noise suppression test sets more challenging and diverse while being sample efficient. Aura is `ears-off' because it relies on a feature extractor and a metric of speech quality, DNSMOS P.835, both pre-trained on data obtained from public sources. As an application of Aura, we augment the INTERSPEECH 2021 DNS challenge by sampling audio files from a new batch of data of 20K clean speech clips from Librivox mixed with noise clips obtained from AudioSet. Aura makes the existing benchmark test set harder by 0.27 in DNSMOS P.835 OVLR (7%), 0.64 harder in DNSMOS P.835 SIG (16%), increases diversity by 31%, and achieves a 26% improvement in Spearman's rank correlation coefficient (SRCC) compared to random sampling. Finally, we open-source Aura to stimulate research of test set development.

翻译：在生产环境中运行的降噪模型通常是在公共可用的数据集上进行训练的。然而，由于缺乏代表性的客户数据进行培训和测试，这种方法会导致退化。此外，由于隐私原因，开发人员不能听取客户内容。这种“无法听取”的情况激发了以保护隐私的方式增强现有数据集的需求。在本文中，我们提出了一种叫做Aura的解决方案，以使现有降噪测试集更具挑战性并增加多样性，同时具有样本效率。Aura是“无法听取”的，因为它依赖于特征提取器和语音质量度量DNSMOS P.835，这两者都是在公共来源的数据上进行预训练的。作为Aura的一个应用，我们使用从Librivox获取的20K个干净语音剪辑与从AudioSet获取的噪声剪辑混合来采样音频文件，从而增强INTERSPEECH 2021 DNS挑战赛的现有基准测试集。Aura使DNSMOS P.835 OVLR指标增加了0.27（7%），使DNSMOS P.835 SIG指标加了0.64（16%），增加了31%的多样性，并且Spearman等级相关系数（SRCC）比随机抽样提高了26% 。最后，我们开源Aura，以促进测试集开发的研究。

0

相关内容

测试集

测试集，在AI领域多指机器学习模型训练完成后，用于其测试的数据，以观测其性能以及泛化能力。

【SIGMOD教程】高效数据标签的众包实践:聚合、增量重标签和定价，附180页slides

【SIGMOD教程】高效数据标签的众包实践:聚合、增量重标签和定价，附180页slides

专知会员服务

11+阅读 · 2022年10月20日

【干货书】隐私保留机器学习，Privacy-Preserving Machine Learning

【干货书】隐私保留机器学习，Privacy-Preserving Machine Learning

专知会员服务

27+阅读 · 2022年4月6日

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

专知会员服务

32+阅读 · 2022年3月12日

【KDD2021】元自训练的少样本神经序列标记

专知会员服务

32+阅读 · 2021年7月2日

CVPR2021 百度研究院 | 半监督迁移学习的自适应一致性正则化

专知会员服务

31+阅读 · 2021年3月20日

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知会员服务

33+阅读 · 2021年3月7日

最新《联邦学习Federated Learning》报告，Federated Learning

最新《联邦学习Federated Learning》报告，Federated Learning

专知会员服务

89+阅读 · 2020年12月2日

【Google】深度学习对抗鲁棒性，43页ppt

专知会员服务

45+阅读 · 2020年10月31日

【AAAI2020论文】隐私保留GBDT（Privacy-Preserving Gradient Boosting Decision Trees）

【AAAI2020论文】隐私保留GBDT（Privacy-Preserving Gradient Boosting Decision Trees）

专知会员服务

36+阅读 · 2019年11月15日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

【SIGMOD2022教程】高效数据标签的众包实践:聚合、增量重标签和定价，附180页slides

【SIGMOD2022教程】高效数据标签的众包实践:聚合、增量重标签和定价，附180页slides

专知

0+阅读 · 2022年10月20日

特征筛选还在用XGB的Feature Importance？试试Permutation Importance

特征筛选还在用XGB的Feature Importance？试试Permutation Importance

PaperWeekly

0+阅读 · 2022年9月30日

NeurlPS2022推荐系统论文集锦

NeurlPS2022推荐系统论文集锦

机器学习与推荐算法

1+阅读 · 2022年9月26日

VCIP 2022 Call for Demos

VCIP 2022 Call for Demos

CCF多媒体专委会

1+阅读 · 2022年6月6日

强化学习三篇论文避免遗忘等

强化学习三篇论文避免遗忘等

CreateAMind

20+阅读 · 2019年5月24日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

【SIGIR2018】五篇对抗训练文章

【SIGIR2018】五篇对抗训练文章

专知

12+阅读 · 2018年7月9日

LibRec 精选：推荐的可解释性[综述]

LibRec 精选：推荐的可解释性[综述]

LibRec智能推荐

10+阅读 · 2018年5月4日

移动云服务中的隐私保护与安全保障机制研究

国家自然科学基金

1+阅读 · 2014年12月31日

移动云服务中轻量级设备隐私保护技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

体域网敏感微数据隐私保护关键技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

菌株Pigmentiphaga sp.H8对3,5-二溴-4-羟基苯甲酸的降解及脱溴机制

国家自然科学基金

0+阅读 · 2013年12月31日

纳米粒子存在下活性污泥胞外聚合物的产生特性及对微生物细胞的保护作用机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

水分对淀粉微波加热过程的介电增强作用及结晶结构的影响

国家自然科学基金

0+阅读 · 2013年12月31日

基于三元粗糙输出编码的带自适应惩罚因子的支持向量机多分类模型研究

国家自然科学基金

0+阅读 · 2012年12月31日

高k材料MOSFET沟道电子迁移率的增强研究

国家自然科学基金

0+阅读 · 2012年12月31日

云存储的隐私保护和安全保障机制

国家自然科学基金

0+阅读 · 2011年12月31日

基于安全多方计算的数据挖掘隐私保护研究

国家自然科学基金

4+阅读 · 2008年12月31日

Active Learning Principles for In-Context Learning with Large Language Models

Arxiv

0+阅读 · 2023年5月23日

Using In-Context Learning to Improve Dialogue Safety

Arxiv

0+阅读 · 2023年5月23日

A Rank-Based Sequential Test of Independence

Arxiv

0+阅读 · 2023年5月23日

SE-Bridge: Speech Enhancement with Consistent Brownian Bridge

Arxiv

0+阅读 · 2023年5月23日

Restore Anything Pipeline: Segment Anything Meets Image Restoration

Arxiv

0+阅读 · 2023年5月22日

Quantifying Association Capabilities of Large Language Models and Its Implications on Privacy Leakage

Arxiv

0+阅读 · 2023年5月22日

Pilotless Uplink for Massive MIMO Systems

Arxiv

0+阅读 · 2023年5月21日

A Comprehensive Survey on Segment Anything Model for Vision and Beyond

Arxiv

3+阅读 · 2023年5月19日

A Survey of Knowledge-Enhanced Pre-trained Language Models

Arxiv

18+阅读 · 2022年11月17日

Privacy and Robustness in Federated Learning: Attacks and Defenses

Arxiv

35+阅读 · 2020年12月7日

VIP会员

文章信息

相关主题

特征提取器

相关VIP内容

【SIGMOD教程】高效数据标签的众包实践:聚合、增量重标签和定价，附180页slides

【SIGMOD教程】高效数据标签的众包实践:聚合、增量重标签和定价，附180页slides

专知会员服务

11+阅读 · 2022年10月20日

【干货书】隐私保留机器学习，Privacy-Preserving Machine Learning

【干货书】隐私保留机器学习，Privacy-Preserving Machine Learning

专知会员服务

27+阅读 · 2022年4月6日

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

专知会员服务

32+阅读 · 2022年3月12日

【KDD2021】元自训练的少样本神经序列标记

专知会员服务

32+阅读 · 2021年7月2日

CVPR2021 百度研究院 | 半监督迁移学习的自适应一致性正则化

专知会员服务

31+阅读 · 2021年3月20日

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知会员服务

33+阅读 · 2021年3月7日

最新《联邦学习Federated Learning》报告，Federated Learning

最新《联邦学习Federated Learning》报告，Federated Learning

专知会员服务

89+阅读 · 2020年12月2日

【Google】深度学习对抗鲁棒性，43页ppt

专知会员服务

45+阅读 · 2020年10月31日

【AAAI2020论文】隐私保留GBDT（Privacy-Preserving Gradient Boosting Decision Trees）

【AAAI2020论文】隐私保留GBDT（Privacy-Preserving Gradient Boosting Decision Trees）

专知会员服务

36+阅读 · 2019年11月15日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

【SIGMOD2022教程】高效数据标签的众包实践:聚合、增量重标签和定价，附180页slides

【SIGMOD2022教程】高效数据标签的众包实践:聚合、增量重标签和定价，附180页slides

专知

0+阅读 · 2022年10月20日

特征筛选还在用XGB的Feature Importance？试试Permutation Importance

特征筛选还在用XGB的Feature Importance？试试Permutation Importance

PaperWeekly

0+阅读 · 2022年9月30日

NeurlPS2022推荐系统论文集锦

NeurlPS2022推荐系统论文集锦

机器学习与推荐算法

1+阅读 · 2022年9月26日

VCIP 2022 Call for Demos

VCIP 2022 Call for Demos

CCF多媒体专委会

1+阅读 · 2022年6月6日

强化学习三篇论文避免遗忘等

强化学习三篇论文避免遗忘等

CreateAMind

20+阅读 · 2019年5月24日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

【SIGIR2018】五篇对抗训练文章

【SIGIR2018】五篇对抗训练文章

专知

12+阅读 · 2018年7月9日

LibRec 精选：推荐的可解释性[综述]

LibRec 精选：推荐的可解释性[综述]

LibRec智能推荐

10+阅读 · 2018年5月4日

相关论文

Active Learning Principles for In-Context Learning with Large Language Models

Arxiv

0+阅读 · 2023年5月23日

Using In-Context Learning to Improve Dialogue Safety

Arxiv

0+阅读 · 2023年5月23日

A Rank-Based Sequential Test of Independence

Arxiv

0+阅读 · 2023年5月23日

SE-Bridge: Speech Enhancement with Consistent Brownian Bridge

Arxiv

0+阅读 · 2023年5月23日

Restore Anything Pipeline: Segment Anything Meets Image Restoration

Arxiv

0+阅读 · 2023年5月22日

Quantifying Association Capabilities of Large Language Models and Its Implications on Privacy Leakage

Arxiv

0+阅读 · 2023年5月22日

Pilotless Uplink for Massive MIMO Systems

Arxiv

0+阅读 · 2023年5月21日

A Comprehensive Survey on Segment Anything Model for Vision and Beyond

Arxiv

3+阅读 · 2023年5月19日

A Survey of Knowledge-Enhanced Pre-trained Language Models

Arxiv

18+阅读 · 2022年11月17日

Privacy and Robustness in Federated Learning: Attacks and Defenses

Arxiv

35+阅读 · 2020年12月7日

相关基金

移动云服务中的隐私保护与安全保障机制研究

国家自然科学基金

1+阅读 · 2014年12月31日

移动云服务中轻量级设备隐私保护技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

体域网敏感微数据隐私保护关键技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

菌株Pigmentiphaga sp.H8对3,5-二溴-4-羟基苯甲酸的降解及脱溴机制

国家自然科学基金

0+阅读 · 2013年12月31日

纳米粒子存在下活性污泥胞外聚合物的产生特性及对微生物细胞的保护作用机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

水分对淀粉微波加热过程的介电增强作用及结晶结构的影响

国家自然科学基金

0+阅读 · 2013年12月31日

基于三元粗糙输出编码的带自适应惩罚因子的支持向量机多分类模型研究

国家自然科学基金

0+阅读 · 2012年12月31日

高k材料MOSFET沟道电子迁移率的增强研究

国家自然科学基金

0+阅读 · 2012年12月31日

云存储的隐私保护和安全保障机制

国家自然科学基金

0+阅读 · 2011年12月31日

基于安全多方计算的数据挖掘隐私保护研究

国家自然科学基金

4+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员