【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf - 专知VIP

会员服务 ·

33

机器学习 · 鲁棒算法 · 麻省理工学院 (MIT) · 博士论文 ·

2022 年 9 月 7 日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

机器学习模型在有偏差的数据集上训练时是有偏差的。最近提出了许多方法，以减轻被确定为先验的偏差。然而，在现实世界的应用中，标注偏差不仅耗时而且具有挑战性。本论文考虑了三种不同的场景，并提出了学习鲁棒模型的新算法。这些算法是有效的，因为它们不需要明确的偏差注释，从而实现了实用的机器学习。

首先，我们引入了一种算法，该算法对从多个环境中收集的数据进行操作，其中偏差特征和标签之间的相关性可能会有所不同。我们表明，当使用在一个环境上训练的分类器对来自不同环境的例子进行预测时，它的错误是隐藏偏见的信息。

然后，我们利用这些错误来创建一组示例，这些示例的插值结果只具有稳定的相关性。我们的算法在四种文本和图像分类任务上实现了最新的技术。然后我们考虑无法访问多个环境的情况，这是新任务或资源有限任务的常见场景。我们证明，在现实世界的应用中，相关的任务往往有类似的偏见。在此基础上，我们提出了一种算法，从资源丰富的源任务中推断出偏差特征，并将这种知识转移到目标任务中。与横跨5个数据集的15个基线相比，我们的方法始终提供显著的性能提升。

最后，我们研究了只给出一组输入标签对的自动偏差检测。我们的算法学习分割数据集，使得在训练分割上训练的分类器不能泛化到测试分割上。性能差距为测量学习特征的偏差程度提供了一个智能体，因此可以用来识别未知偏差。在六个NLP和视觉任务上的实验表明，我们的方法能够产生与人类识别的偏差相关的虚假分裂。

成为VIP会员查看完整内容

59

相关内容

机器学习

“机器学习是近20多年兴起的一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论，机器学习与统计推断学联系尤为密切，也被称为统计学习理论。算法设计方面，机器学习理论关注可以实现的，行之有效的学习算法。很多推论问题属于无程序可循难度，所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【牛津大学博士论文】持续学习的高效机器学习，213页pdf

【牛津大学博士论文】持续学习的高效机器学习，213页pdf

专知会员服务

82+阅读 · 2022年10月19日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

112+阅读 · 2022年10月6日

【MIT博士论文】非参数因果推理的算法方法，424页pdf

【MIT博士论文】非参数因果推理的算法方法，424页pdf

专知会员服务

84+阅读 · 2022年9月20日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知会员服务

104+阅读 · 2022年9月19日

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

专知会员服务

37+阅读 · 2022年9月16日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知会员服务

126+阅读 · 2022年9月11日

【MIT博士论文】异构医疗数据表示学习，193页pdf

【MIT博士论文】异构医疗数据表示学习，193页pdf

专知会员服务

59+阅读 · 2022年9月3日

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

专知会员服务

105+阅读 · 2022年9月1日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知会员服务

52+阅读 · 2022年8月31日

【纽约大学Martin Arjovsky 博士论文】机器学习的分布外泛化,106页pdf

【纽约大学Martin Arjovsky 博士论文】机器学习的分布外泛化,106页pdf

专知会员服务

60+阅读 · 2021年3月28日

【伯克利博士论文】学习在动态环境中泛化，103页pdf

【伯克利博士论文】学习在动态环境中泛化，103页pdf

专知

6+阅读 · 2022年10月12日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

【斯坦福博士论文】不确定性和信息为机器学习提供决策支持，235页pdf

【斯坦福博士论文】不确定性和信息为机器学习提供决策支持，235页pdf

专知

9+阅读 · 2022年9月10日

【MIT博士论文】异构医疗数据表示学习，193页pdf

【MIT博士论文】异构医疗数据表示学习，193页pdf

专知

2+阅读 · 2022年9月3日

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

专知

4+阅读 · 2022年9月1日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知

8+阅读 · 2022年8月31日

【港科大博士论文】高效迁移学习的低资源自然语言理解，164页pdf

【港科大博士论文】高效迁移学习的低资源自然语言理解，164页pdf

专知

0+阅读 · 2022年8月24日

【MIT博士论文】机器学习与因果关系:建立高效、可靠的决策模型，164页pdf

【MIT博士论文】机器学习与因果关系:建立高效、可靠的决策模型，164页pdf

专知

7+阅读 · 2022年7月10日

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

专知

16+阅读 · 2022年5月3日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于几何形状的彩色纹理分析方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于压缩感知的频率步进连续波探地雷达数据获取与稳健高效成像重建方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

考虑约束条件的自适应空间离群挖掘及应用研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于翻译学习和核方法的中文模糊限制信息检测研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于SVM集成和证据理论的多传感器目标识别技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于多Agent的通信交互式动态影响图研究及应用

国家自然科学基金

2+阅读 · 2009年12月31日

网络攻击行为的高效在线机器学习技术研究

国家自然科学基金

1+阅读 · 2009年12月31日

机器学习中模型选择问题的研究及其在图像理解中的应用

国家自然科学基金

8+阅读 · 2008年12月31日

Analyzing the Robustness of Decentralized Horizontal and Vertical Federated Learning Architectures in a Non-IID Scenario

Arxiv

0+阅读 · 2022年10月20日

Representation Learning with Diffusion Models

Arxiv

1+阅读 · 2022年10月20日

Does Decentralized Learning with Non-IID Unlabeled Data Benefit from Self Supervision?

Arxiv

0+阅读 · 2022年10月20日

A Unified Convergence Theorem for Stochastic Optimization Methods

Arxiv

0+阅读 · 2022年10月19日

Shallow and Deep Nonparametric Convolutions for Gaussian Processes

Arxiv

0+阅读 · 2022年10月18日

Rethinking Value Function Learning for Generalization in Reinforcement Learning

Arxiv

0+阅读 · 2022年10月18日

Simple Emergent Action Representations from Multi-Task Policy Training

Arxiv

0+阅读 · 2022年10月18日

Distributed Graph Convolutional Networks

Arxiv

19+阅读 · 2020年7月13日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Bayesian Convolutional Neural Networks

Arxiv

19+阅读 · 2018年6月27日

VIP会员

相关主题

麻省理工学院 (MIT)

相关VIP内容

【牛津大学博士论文】持续学习的高效机器学习，213页pdf

【牛津大学博士论文】持续学习的高效机器学习，213页pdf

专知会员服务

82+阅读 · 2022年10月19日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

112+阅读 · 2022年10月6日

【MIT博士论文】非参数因果推理的算法方法，424页pdf

【MIT博士论文】非参数因果推理的算法方法，424页pdf

专知会员服务

84+阅读 · 2022年9月20日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知会员服务

104+阅读 · 2022年9月19日

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

专知会员服务

37+阅读 · 2022年9月16日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知会员服务

126+阅读 · 2022年9月11日

【MIT博士论文】异构医疗数据表示学习，193页pdf

【MIT博士论文】异构医疗数据表示学习，193页pdf

专知会员服务

59+阅读 · 2022年9月3日

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

专知会员服务

105+阅读 · 2022年9月1日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知会员服务

52+阅读 · 2022年8月31日

【纽约大学Martin Arjovsky 博士论文】机器学习的分布外泛化,106页pdf

【纽约大学Martin Arjovsky 博士论文】机器学习的分布外泛化,106页pdf

专知会员服务

60+阅读 · 2021年3月28日

热门VIP内容

开通专知VIP会员享更多权益服务

【ACL2025教程】大语言模型的护栏与安全性：对其应用的安全、可靠与可控引导

《实现协同自主：从人机协作到多智能体系统》最新190页

【ICML2025】SToFM：一种用于空间转录组学的多尺度基础模型

通信网络智能体白皮书V1.0，61页pdf

相关资讯

【伯克利博士论文】学习在动态环境中泛化，103页pdf

【伯克利博士论文】学习在动态环境中泛化，103页pdf

专知

6+阅读 · 2022年10月12日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

【斯坦福博士论文】不确定性和信息为机器学习提供决策支持，235页pdf

【斯坦福博士论文】不确定性和信息为机器学习提供决策支持，235页pdf

专知

9+阅读 · 2022年9月10日

【MIT博士论文】异构医疗数据表示学习，193页pdf

【MIT博士论文】异构医疗数据表示学习，193页pdf

专知

2+阅读 · 2022年9月3日

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

专知

4+阅读 · 2022年9月1日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知

8+阅读 · 2022年8月31日

【港科大博士论文】高效迁移学习的低资源自然语言理解，164页pdf

【港科大博士论文】高效迁移学习的低资源自然语言理解，164页pdf

专知

0+阅读 · 2022年8月24日

【MIT博士论文】机器学习与因果关系:建立高效、可靠的决策模型，164页pdf

【MIT博士论文】机器学习与因果关系:建立高效、可靠的决策模型，164页pdf

专知

7+阅读 · 2022年7月10日

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

专知

16+阅读 · 2022年5月3日

相关基金

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于几何形状的彩色纹理分析方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于压缩感知的频率步进连续波探地雷达数据获取与稳健高效成像重建方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

考虑约束条件的自适应空间离群挖掘及应用研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于翻译学习和核方法的中文模糊限制信息检测研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于SVM集成和证据理论的多传感器目标识别技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于多Agent的通信交互式动态影响图研究及应用

国家自然科学基金

2+阅读 · 2009年12月31日

网络攻击行为的高效在线机器学习技术研究

国家自然科学基金

1+阅读 · 2009年12月31日

机器学习中模型选择问题的研究及其在图像理解中的应用

国家自然科学基金

8+阅读 · 2008年12月31日

相关论文

Analyzing the Robustness of Decentralized Horizontal and Vertical Federated Learning Architectures in a Non-IID Scenario

Arxiv

0+阅读 · 2022年10月20日

Representation Learning with Diffusion Models

Arxiv

1+阅读 · 2022年10月20日

Does Decentralized Learning with Non-IID Unlabeled Data Benefit from Self Supervision?

Arxiv

0+阅读 · 2022年10月20日

A Unified Convergence Theorem for Stochastic Optimization Methods

Arxiv

0+阅读 · 2022年10月19日

Shallow and Deep Nonparametric Convolutions for Gaussian Processes

Arxiv

0+阅读 · 2022年10月18日

Rethinking Value Function Learning for Generalization in Reinforcement Learning

Arxiv

0+阅读 · 2022年10月18日

Simple Emergent Action Representations from Multi-Task Policy Training

Arxiv

0+阅读 · 2022年10月18日

Distributed Graph Convolutional Networks

Arxiv

19+阅读 · 2020年7月13日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Bayesian Convolutional Neural Networks

Arxiv

19+阅读 · 2018年6月27日

微信扫码咨询专知VIP会员