Large language models (LLMs) are reshaping automated program repair. We present a unified taxonomy that groups 62 recent LLM-based repair systems into four paradigms defined by parameter adaptation and control authority over the repair loop, and overlays two cross-cutting layers for retrieval and analysis augmentation. Prior surveys have either focused on classical software repair techniques, on LLMs in software engineering more broadly, or on subsets of LLM-based software repair, such as fine-tuning strategies or vulnerability repair. We complement these works by treating fine-tuning, prompting, procedural pipelines, and agentic frameworks as first-class paradigms and systematically mapping representative systems to each of these paradigms. We also consolidate evaluation practice on common benchmarks by recording benchmark scope, pass@k, and fault-localization assumptions to support a more meaningful comparison of reported success rates. We clarify trade-offs among paradigms in task alignment, deployment cost, controllability, and ability to repair multi-hunk or cross-file bugs. We discuss challenges in current LLM-based software repair and outline research directions. Our artifacts, including the representation papers and scripted survey pipeline, are publicly available at https://github.com/GLEAM-Lab/ProgramRepair.


翻译:大语言模型(LLMs)正在重塑自动化程序修复领域。本文提出一个统一的分类体系,将62个近期基于LLM的修复系统归纳为四种范式,这些范式由参数适配方式和修复循环控制权限定义,并叠加了检索与分析增强两个交叉层。现有综述或聚焦于经典软件修复技术,或广泛讨论LLM在软件工程中的应用,或仅涵盖基于LLM的软件修复子集(如微调策略或漏洞修复)。本文通过将微调、提示工程、流程化管道和智能体框架作为一级范式,并将代表性系统系统化映射至各范式,对现有研究形成补充。我们通过记录基准测试范围、pass@k指标及错误定位假设,整合了通用基准上的评估实践,以支持对报告修复成功率进行更有意义的比较。本文阐明了各范式在任务对齐、部署成本、可控性以及修复多块(multi-hunk)或跨文件缺陷能力方面的权衡,讨论了当前基于LLM的软件修复面临的挑战,并展望了研究方向。相关资源(包括代表性论文和可复现的综述流程脚本)已在https://github.com/GLEAM-Lab/ProgramRepair公开。

0
下载
关闭预览

相关内容

软件(中国大陆及香港用语,台湾作软体,英文:Software)是一系列按照特定顺序组织的计算机数据和指令的集合。一般来讲软件被划分为编程语言、系统软件、应用软件和介于这两者之间的中间件。软件就是程序加文档的集合体。
KnowledGPT:基于知识库的检索和存储访问增强大型语言模型
Python计算导论,560页pdf,Introduction to Computing Using Python
专知会员服务
76+阅读 · 2020年5月5日
论文笔记之Feature Selective Networks for Object Detection
统计学习与视觉计算组
21+阅读 · 2018年7月26日
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员