题目: An Overview of Privacy in Machine Learning

序言: 在过去几年中,谷歌、微软和亚马逊等供应商已经开始为客户提供软件接口,使他们能够轻松地将机器学习任务嵌入到他们的应用程序中。总的来说,机构现在可以使用机器学习作为服务(MLaaS)引擎来外包复杂的任务,例如训练分类器、执行预测、聚类等等。他们还可以让其他人根据他们的数据查询模型。当然,这种方法也可以在其他情况下使用(并且经常提倡使用),包括政府协作、公民科学项目和企业对企业的伙伴关系。然而,如果恶意用户能够恢复用于训练这些模型的数据,那么由此导致的信息泄漏将会产生严重的问题。同样,如果模型的内部参数被认为是专有信息,那么对模型的访问不应该允许对手了解这些参数。在本文中,我们对这一领域的隐私挑战进行了回顾,系统回顾了相关的研究文献,并探讨了可能的对策。具体地说,我们提供了大量关于机器学习和隐私相关概念的背景信息。然后,我们讨论了可能的对抗模型和设置,涵盖了与隐私和/或敏感信息泄漏有关的广泛攻击,并回顾了最近试图防御此类攻击的结果。最后,我们总结出一系列需要更多工作的开放问题,包括需要更好的评估、更有针对性的防御,以及研究与政策和数据保护工作的关系。

成为VIP会员查看完整内容
78

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
图数据表示学习综述论文
专知
51+阅读 · 2019年6月10日
差分隐私保护:从入门到脱坑
FreeBuf
17+阅读 · 2018年9月10日
Andrew NG的新书《Machine Learning Yearning》
我爱机器学习
11+阅读 · 2016年12月7日
Advances and Open Problems in Federated Learning
Arxiv
17+阅读 · 2019年12月10日
Arxiv
20+阅读 · 2019年11月24日
A Comprehensive Survey on Transfer Learning
Arxiv
117+阅读 · 2019年11月7日
Generative Adversarial Networks: A Survey and Taxonomy
Deep Reinforcement Learning: An Overview
Arxiv
17+阅读 · 2018年11月26日
Arxiv
150+阅读 · 2017年8月1日
VIP会员
相关论文
Advances and Open Problems in Federated Learning
Arxiv
17+阅读 · 2019年12月10日
Arxiv
20+阅读 · 2019年11月24日
A Comprehensive Survey on Transfer Learning
Arxiv
117+阅读 · 2019年11月7日
Generative Adversarial Networks: A Survey and Taxonomy
Deep Reinforcement Learning: An Overview
Arxiv
17+阅读 · 2018年11月26日
Arxiv
150+阅读 · 2017年8月1日
微信扫码咨询专知VIP会员