本系统综述探讨了大语言模型(LLMs)在组合优化(CO)中的应用。我们遵循系统综述与元分析的首选报告项目(PRISMA)指南报告我们的研究发现。我们通过Scopus和Google Scholar进行了文献检索,检查了超过2,000篇文献。我们根据四项纳入标准和四项排除标准对文献进行了评估,这些标准涉及语言、研究重点、出版年份和类型。最终,我们选择了103篇研究。我们将这些研究按语义类别和主题进行分类,以提供该领域的全面概述,包括LLMs执行的任务、LLMs的架构、专门为评估LLMs在CO中应用设计的数据集以及应用领域。最后,我们确定了利用LLMs在该领域的未来发展方向。

关键词:系统综述 · 大语言模型 · 组合优化

1 引言

组合优化问题(COPs)是一类优化问题,其特点是离散的变量域和有限的搜索空间。组合优化(CO)在许多需要复杂决策能力的领域中发挥着至关重要的作用,如工业调度[219]、员工排班[25, 102]、设施选址[27, 64]和时间表安排[199, 254]等。传统上,这类问题通过线性规划(LP)、整数线性规划(ILP)、混合整数线性规划(MILP)和约束规划(CP)等技术进行建模,并通过商业求解器,如IBM ILOG CPLEX [88]或Gurobi [70],以及启发式和元启发式(MH)算法[194]来求解。 尽管许多成功的CO应用已被开发出来,但优化任务的设计和工程仍主要由人工驱动。用户必须通过定义一组变量、约束和一个或多个目标函数,将问题转化为优化模型,然后编写代码并运行软件求解器或算法来寻找解决方案。这些活动并非简单,需要一定的专业知识。 受最近大语言模型(LLMs)在执行广泛复杂任务中的应用进展的启发,越来越多的兴趣集中在将LLMs集成到CO中,以减轻优化过程中的人工密集型环节[53, 84, 145, 236]。LLMs处理、解释和生成自然语言的能力使其特别适合解决CO中的活动,包括将自然语言描述转化为数学模型等形式化表达[74, 89]以及代码生成[111, 214]。 人工智能(AI)特别是自然语言处理(NLP)的快速发展,使得LLMs的能力和应用大幅提升,导致了大量学术研究和模型的开发。尽管这个领域的活动日益增多,但这大量的研究成果也形成了一个复杂的知识体系,难以轻松掌握。特别是针对LLMs在CO中的应用,现有的学术文献较为有限且零散,现有的研究工作在方法学、应用领域和研究发现上存在较大差异。因此,本系统综述旨在整合当前LLMs应用于CO的最先进成果。我们通过筛选、分析和系统地组织文献,以澄清该主题并确定当前和未来研究的战略方向。我们遵循系统综述和元分析首选报告项目(PRISMA)指南进行报告。通过这一研究,我们旨在了解LLMs在解决复杂优化任务中的能力,并探索该领域中不断发展的趋势和方向。通过系统地综合和分析现有研究,本综述旨在提供一个结构化的理解,帮助理解LLMs如何在CO中应用,并为未来研究提供启示。

本综述的结构如下:第2节讨论了驱动我们工作的目标和动机;第3节探讨了与相关工作的关系和区别;第4节提供了理解LLMs与CO之间相互关系所需的背景;第5节详细介绍了我们遵循的方法论;第6节对我们综述中纳入的研究进行了分类和讨论;第7节概述了未来的研究方向;第8节讨论了我们方法的局限性;最后,第9节给出了结论并提出了未来的研究工作。

成为VIP会员查看完整内容
13

相关内容

大语言模型是基于海量文本数据训练的深度学习模型。它不仅能够生成自然语言文本,还能够深入理解文本含义,处理各种自然语言任务,如文本摘要、问答、翻译等。2023年,大语言模型及其在人工智能领域的应用已成为全球科技研究的热点,其在规模上的增长尤为引人注目,参数量已从最初的十几亿跃升到如今的一万亿。参数量的提升使得模型能够更加精细地捕捉人类语言微妙之处,更加深入地理解人类语言的复杂性。在过去的一年里,大语言模型在吸纳新知识、分解复杂任务以及图文对齐等多方面都有显著提升。随着技术的不断成熟,它将不断拓展其应用范围,为人类提供更加智能化和个性化的服务,进一步改善人们的生活和生产方式。
大型语言模型在生物信息学中的应用综述
专知会员服务
16+阅读 · 3月15日
关于大语言模型驱动的推荐系统智能体的综述
专知会员服务
26+阅读 · 2月17日
大规模语言模型的个性化:综述
专知会员服务
42+阅读 · 2024年11月4日
数据与多模态大型语言模型的协同作用综述
专知会员服务
55+阅读 · 2024年7月13日
从数据中心视角看多模态大型语言模型的综述
专知会员服务
57+阅读 · 2024年5月28日
文本生成:任务、评估和挑战的系统综述
专知会员服务
26+阅读 · 2024年5月27日
多语言大型语言模型:资源、分类和前沿综述
专知会员服务
52+阅读 · 2024年4月9日
大型语言模型在预测和异常检测中的应用综述
专知会员服务
70+阅读 · 2024年2月19日
《大型语言模型自然语言生成评估》综述
专知会员服务
70+阅读 · 2024年1月20日
【干货书】优化算法,232页pdf
专知
26+阅读 · 2022年9月8日
基于模型的强化学习综述
专知
41+阅读 · 2022年7月13日
初学者的 Keras:实现卷积神经网络
Python程序员
24+阅读 · 2019年9月8日
干货 | 用 Keras 实现图书推荐系统
AI科技评论
11+阅读 · 2018年12月15日
生成对抗网络的研究进展与趋势
中国计算机学会
35+阅读 · 2018年11月14日
自然语言处理中的语言模型预训练方法
PaperWeekly
14+阅读 · 2018年10月21日
统计学常用数据类型
论智
19+阅读 · 2018年7月6日
从浅层模型到深度模型:概览机器学习优化算法
机器之心
27+阅读 · 2017年7月9日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
Arxiv
170+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
472+阅读 · 2023年3月31日
Arxiv
78+阅读 · 2023年3月26日
Arxiv
171+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关VIP内容
大型语言模型在生物信息学中的应用综述
专知会员服务
16+阅读 · 3月15日
关于大语言模型驱动的推荐系统智能体的综述
专知会员服务
26+阅读 · 2月17日
大规模语言模型的个性化:综述
专知会员服务
42+阅读 · 2024年11月4日
数据与多模态大型语言模型的协同作用综述
专知会员服务
55+阅读 · 2024年7月13日
从数据中心视角看多模态大型语言模型的综述
专知会员服务
57+阅读 · 2024年5月28日
文本生成:任务、评估和挑战的系统综述
专知会员服务
26+阅读 · 2024年5月27日
多语言大型语言模型:资源、分类和前沿综述
专知会员服务
52+阅读 · 2024年4月9日
大型语言模型在预测和异常检测中的应用综述
专知会员服务
70+阅读 · 2024年2月19日
《大型语言模型自然语言生成评估》综述
专知会员服务
70+阅读 · 2024年1月20日
相关资讯
【干货书】优化算法,232页pdf
专知
26+阅读 · 2022年9月8日
基于模型的强化学习综述
专知
41+阅读 · 2022年7月13日
初学者的 Keras:实现卷积神经网络
Python程序员
24+阅读 · 2019年9月8日
干货 | 用 Keras 实现图书推荐系统
AI科技评论
11+阅读 · 2018年12月15日
生成对抗网络的研究进展与趋势
中国计算机学会
35+阅读 · 2018年11月14日
自然语言处理中的语言模型预训练方法
PaperWeekly
14+阅读 · 2018年10月21日
统计学常用数据类型
论智
19+阅读 · 2018年7月6日
从浅层模型到深度模型:概览机器学习优化算法
机器之心
27+阅读 · 2017年7月9日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员