Over the last few months, AI models including large language models have improved greatly. There are now several documented examples where they have helped professional mathematical scientists prove new results, sometimes even helping resolve known open problems. In this short note, we add another example to the list, by documenting how we were able to solve a previously unsolved research problem in robust mathematical statistics with crucial help from GPT-5. Our problem concerns robust density estimation, where the observations are perturbed by Wasserstein-bounded contaminations. In a previous preprint (Chao and Dobriban, 2023, arxiv:2308.01853v2), we have obtained upper and lower bounds on the minimax optimal estimation error; which were, however, not sharp. Starting in October 2025, making significant use of GPT-5 Pro, we were able to derive the minimax optimal error rate (reported in version 3 of the above arxiv preprint). GPT-5 provided crucial help along the way, including by suggesting calculations that we did not think of, and techniques that were not familiar to us, such as the dynamic Benamou-Brenier formulation, for key steps in the analysis. Working with GPT-5 took a few weeks of effort, and we estimate that it could have taken several months to get the same results otherwise. At the same time, there are still areas where working with GPT-5 was challenging: it sometimes provided incorrect references, and glossed over details that sometimes took days of work to fill in. We outline our workflow and steps taken to mitigate issues. Overall, our work can serve as additional documentation for a new age of human-AI collaborative work in mathematical science.


翻译:在过去几个月中,包括大语言模型在内的人工智能模型取得了显著进步。目前已有多项记录表明,它们能够帮助专业数学科学家证明新结果,有时甚至助力解决已知的开放性问题。在这篇简短报告中,我们通过记录如何借助GPT-5的关键性帮助,解决了一个先前未解决的鲁棒数理统计研究问题,为该领域增添了新的案例。我们的研究聚焦于鲁棒密度估计问题,其中观测数据受到Wasserstein有界污染的干扰。在先前的一篇预印本(Chao and Dobriban, 2023, arxiv:2308.01853v2)中,我们已获得极小化极大最优估计误差的上界与下界,但这些界限尚未达到尖锐性。自2025年10月起,通过深入运用GPT-5 Pro,我们成功推导出了极小化极大最优误差率(已发表于上述arXiv预印本的第三版)。GPT-5在研究过程中提供了关键性协助,包括提出我们未曾想到的计算方法,以及推荐我们原本不熟悉的技术(例如动态Benamou-Brenier公式化方法)用于分析的关键步骤。与GPT-5协作花费了数周时间,我们估计若采用传统方法可能需要数月才能获得相同结果。与此同时,与GPT-5协作仍存在挑战:它有时会提供错误参考文献,并忽略某些需要数日工作才能补充的细节。我们概述了工作流程及为缓解这些问题采取的措施。总体而言,本研究可作为数学科学领域人机协同新时代的补充文献记录。

0
下载
关闭预览

相关内容

图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
读论文Discriminative Deep Metric Learning for Face and KV
统计学习与视觉计算组
12+阅读 · 2018年4月6日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
Arxiv
0+阅读 · 12月16日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员