Over the last few months, AI models including large language models have improved greatly. There are now several documented examples where they have helped professional mathematical scientists prove new results, sometimes even helping resolve known open problems. In this short note, we add another example to the list, by documenting how we were able to solve a previously unsolved research problem in robust mathematical statistics with crucial help from GPT-5. Our problem concerns robust density estimation, where the observations are perturbed by Wasserstein-bounded contaminations. In a previous preprint (Chao and Dobriban, 2023, arxiv:2308.01853v2), we have obtained upper and lower bounds on the minimax optimal estimation error; which were, however, not sharp. Starting in October 2025, making significant use of GPT-5 Pro, we were able to derive the minimax optimal error rate (reported in version 3 of the above arxiv preprint). GPT-5 provided crucial help along the way, including by suggesting calculations that we did not think of, and techniques that were not familiar to us, such as the dynamic Benamou-Brenier formulation, for key steps in the analysis. Working with GPT-5 took a few weeks of effort, and we estimate that it could have taken several months to get the same results otherwise. At the same time, there are still areas where working with GPT-5 was challenging: it sometimes provided incorrect references, and glossed over details that sometimes took days of work to fill in. We outline our workflow and steps taken to mitigate issues. Overall, our work can serve as additional documentation for a new age of human-AI collaborative work in mathematical science.


翻译:过去几个月,包括大语言模型在内的人工智能模型取得了显著进步。目前已有多项记录表明,这些模型帮助专业数学科学家证明了新的结果,有时甚至助力解决了已知的开放性问题。在这篇短文中,我们通过记录如何借助GPT-5的关键帮助解决了一个先前未解决的鲁棒数理统计研究问题,为该列表增添了新的案例。我们的研究关注鲁棒密度估计问题,其中观测数据受到Wasserstein有界污染的干扰。在之前的预印本(Chao与Dobriban,2023,arxiv:2308.01853v2)中,我们已获得极小极大最优估计误差的上界与下界,但这些界限并不尖锐。自2025年10月起,通过充分利用GPT-5 Pro,我们成功推导出了极小极大最优误差率(已发表于上述arXiv预印本的第三版)。GPT-5在此过程中提供了关键帮助,包括提出我们未曾想到的计算方法,以及为我们不熟悉的技术(如动态Benamou-Brenier公式)在分析的关键步骤中提供思路。与GPT-5协作花费了数周时间,我们估计若无其协助,取得相同结果可能需要数月。同时,与GPT-5协作仍存在挑战:它有时会提供错误的参考文献,并忽略某些需要数日工作才能填补的细节。我们概述了工作流程及为缓解问题所采取的措施。总体而言,本研究可作为数学科学领域人机协作新时代的补充文献记录。

0
下载
关闭预览

相关内容

论文浅尝 | Interaction Embeddings for Prediction and Explanation
开放知识图谱
11+阅读 · 2019年2月1日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
Arxiv
0+阅读 · 12月16日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员