在高风险环境中部署机器学习系统时,预测结果将直接影响从医学诊断到基础设施管理以及科学发现等关键决策,因此,对不确定性的可靠量化至关重要。本文围绕概率预测开展研究,重点在于通过实现校准(calibration)来提升不确定性估计的可信度——即预测概率应与事件的经验频率保持一致,例如:置信度为90%的区间应有90%的概率覆盖实际观测结果。 我提出了贯穿整个模型生命周期的多种干预方法,用于提升模型的校准性能:包括在训练阶段设计优化目标以鼓励校准、在后处理阶段修正误校准的方法,以及在部署阶段于非平稳环境中自适应保持校准的在线技术。 论文第一部分聚焦于后验重校准(post-hoc recalibration)。我提出了模块化保序校准(modular conformal calibration)这一通用框架,它涵盖并扩展了现有的后验不确定性量化方法,如保序回归(isotonic regression)保序预测(conformal prediction)。该框架明确了重校准策略的设计空间,并为使用这些策略重校准后的任意模型提供有限样本下的校准保证。这一框架使实践者能够在计算开销、概率解释性、确定性行为与校准强度之间进行权衡。 第二部分关注训练阶段的校准策略,目标是在保持预测“锐度”(即预测结果的自信度与信息量)的同时增强模型的校准性。我提出了一类可微分的校准度量,可作为正则化目标嵌入到训练过程中,使校准性与锐度得以联合优化。这些目标函数覆盖了许多用于回归与分类任务的主流校准指标,这些指标此前往往仅在训练后进行施加。该方法还支持任务定制的校准目标,使得模型的不确定性估计在统计上保持一致性,并能够契合下游决策场景的实际需求。 第三部分探讨了分布漂移(distribution shift)下的校准问题,这是现实部署中的核心挑战之一。我研究了一个在线预测设置,其中数据可能随时间演化或由对手策略生成。基于Blackwell可达性理论(Blackwell approachability theory),我提出了一种通用策略,可在最小假设下针对任意观测序列实现校准保证。该框架支持多种校准概念,包括分布校准与决策校准,并提供基于oracle的方法与可计算的算法。我进一步提出了基于梯度的松弛算法,在扩大适用范围的同时,部分放宽了理论保证。实验证明,这些方法在保持校准预测的同时,对比专家预测器可获得渐进无悔(vanishing regret)。 总的来说,本论文提出了一套系统化的、理论支撑的策略,用以提升概率模型在整个开发流程中的不确定性估计灵活性与可靠性。通过在模型生命周期的各阶段强制实现多种形式的校准,本文为实际应用中高风险决策提供了稳健可信的模型支持。

成为VIP会员查看完整内容
0

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【CMU博士论文】评估算法系统的隐私性与问责性
【阿姆斯特丹博士论文】带约束学习的优化算法
【MIT博士论文】物理启发的生成式模型
专知会员服务
31+阅读 · 2024年9月6日
【MIT博士论文】理解与提升机器学习模型的表征鲁棒性
专知会员服务
27+阅读 · 2024年8月26日
论文浅尝 | 时序与因果关系联合推理
开放知识图谱
35+阅读 · 2019年6月23日
论文浅尝 | 区分概念和实例的知识图谱嵌入方法
开放知识图谱
17+阅读 · 2019年1月19日
论文浅尝 | 基于深度强化学习的远程监督数据集的降噪
开放知识图谱
29+阅读 · 2019年1月17日
论文浅尝 | 基于神经网络的知识推理
开放知识图谱
14+阅读 · 2018年3月12日
超级干货 :一文读懂特征工程
数据分析
10+阅读 · 2017年9月6日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
171+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
473+阅读 · 2023年3月31日
Arxiv
78+阅读 · 2023年3月26日
Arxiv
172+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员