近年来,大语言模型(LLMs)显著推动了法律人工智能(Legal AI)的发展,提升了法律任务的效率与准确性。为了进一步推进基于LLM的方法在法律领域的研究与应用,本文对 16 个法律领域LLM系列47 个基于LLM的法律任务框架 进行了全面综述,并汇总了 15 个基准测试29 个数据集,用于评估不同的法律能力。此外,我们还分析了面临的挑战,并探讨了基于LLM的法律方法在未来的发展方向。我们希望本文能够为初学者提供系统性的入门介绍,并激发该领域的后续研究。相关资源可在 https://github.com/ZhitianHou/LLMs4LegalAI 获取。

1 引言

法律人工智能(Legal AI)主要关注利用人工智能方法来支持各类法律任务,例如 法律判决预测(Feng et al., 2022)、法律案例检索(Feng et al., 2024)以及 法律文书摘要生成(Shukla et al., 2022)。Legal AI 在法律领域具有重要影响,它不仅能减轻法律专业人士在重复性和高强度任务中的负担,还能为缺乏法律专业知识的个体提供可靠指导,从而成为一种可负担的法律辅助形式(Zhong et al., 2020a)。 随着大语言模型(LLMs)在多个领域取得显著成功(Zan et al., 2023; Hu et al., 2024; Kim et al., 2024b; Tan et al., 2024),LLMs 已日益广泛地应用于法律领域,用以解决多样化的法律任务(Wu et al., 2023b; Deng et al., 2024a; Godbole et al., 2024)。如图 1 所示,LLMs 在法律领域的应用主要包括两类:其一是通过微调训练得到新的 法律专用 LLMs;其二是基于 LLM 的框架(即直接利用现有 LLM 而无需微调),用于应对传统法律任务。此外,研究者还开发了用于训练和评估 LLM 的法律数据集。尽管基于 LLM 的方法在法律领域已展现出令人瞩目的性能,但目前仍缺乏对相关研究的系统性综述与分析。为填补这一空白,本文对法律领域中 LLM 的研究进行了深入探讨,重点涵盖现有数据集、先进方法、面临的挑战及未来发展方向。 本文的主要贡献如下: * 全面综述:据我们所知,这是首个系统性回顾法律人工智能数据集(包括传统数据集与 LLM 专用数据集)以及基于 LLM 的方法(包括法律专用 LLMs 与 LLM 框架)的工作。 * 数据集分析:我们对现有的 Legal AI 数据集进行了深入分析,全面概述了其特征与特点。 * 精细化分类体系:我们提出了一套细致的分类方法,将法律专用 LLMs 与基于 LLM 的框架加以区分,并根据其所处理的任务对框架进一步进行归类。 * 挑战与未来方向:我们总结了当前基于 LLM 的法律应用所面临的挑战,并提出了未来研究的建议。

综述结构 如图 2 所示,本文的结构安排如下:首先介绍数据集与评价指标(§2);接着讨论先进的法律专用 LLMs 与基于 LLM 的框架相关研究(§3);随后分析所面临的挑战(§4);最后展望未来的研究方向(§5)。

成为VIP会员查看完整内容
2

相关内容

大语言模型是基于海量文本数据训练的深度学习模型。它不仅能够生成自然语言文本,还能够深入理解文本含义,处理各种自然语言任务,如文本摘要、问答、翻译等。2023年,大语言模型及其在人工智能领域的应用已成为全球科技研究的热点,其在规模上的增长尤为引人注目,参数量已从最初的十几亿跃升到如今的一万亿。参数量的提升使得模型能够更加精细地捕捉人类语言微妙之处,更加深入地理解人类语言的复杂性。在过去的一年里,大语言模型在吸纳新知识、分解复杂任务以及图文对齐等多方面都有显著提升。随着技术的不断成熟,它将不断拓展其应用范围,为人类提供更加智能化和个性化的服务,进一步改善人们的生活和生产方式。
科学大语言模型综述:从数据基础到智能体前沿
脑启发的人工智能:全面综述
专知会员服务
49+阅读 · 2024年8月30日
《计算流体力学中的机器学习最新进展》综述
专知会员服务
34+阅读 · 2024年8月24日
大模型+遥感?最新《遥感中的人工智能基础模型》综述
专知会员服务
61+阅读 · 2024年8月10日
视觉语言导航:大模型时代的综述
专知会员服务
49+阅读 · 2024年7月10日
《大型语言模型加速生成技术》最新综述
专知会员服务
50+阅读 · 2024年5月25日
大型语言模型与智能机器人集成的综述
专知会员服务
69+阅读 · 2024年4月22日
多模态人机交互综述
专知会员服务
148+阅读 · 2022年7月3日
「知识增强预训练语言模型」最新研究综述
专知
18+阅读 · 2022年11月18日
清华大学:从单体仿生到群体智能
专知
18+阅读 · 2022年2月9日
智能合约的形式化验证方法研究综述
专知
16+阅读 · 2021年5月8日
最新《可解释人工智能》概述,50页ppt
专知
10+阅读 · 2021年3月17日
多模态情绪识别研究综述
专知
24+阅读 · 2020年12月21日
基于深度学习的数据融合方法研究综述
专知
35+阅读 · 2020年12月10日
层级强化学习概念简介
CreateAMind
19+阅读 · 2019年6月9日
【深度学习】深度学习技术发展趋势浅析
产业智能官
11+阅读 · 2019年4月13日
【大数据】大数据参考架构和关键技术(综合)
产业智能官
14+阅读 · 2018年11月22日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Arxiv
171+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
482+阅读 · 2023年3月31日
Arxiv
79+阅读 · 2023年3月26日
Arxiv
174+阅读 · 2023年3月24日
Arxiv
25+阅读 · 2023年3月17日
VIP会员
相关VIP内容
科学大语言模型综述:从数据基础到智能体前沿
脑启发的人工智能:全面综述
专知会员服务
49+阅读 · 2024年8月30日
《计算流体力学中的机器学习最新进展》综述
专知会员服务
34+阅读 · 2024年8月24日
大模型+遥感?最新《遥感中的人工智能基础模型》综述
专知会员服务
61+阅读 · 2024年8月10日
视觉语言导航:大模型时代的综述
专知会员服务
49+阅读 · 2024年7月10日
《大型语言模型加速生成技术》最新综述
专知会员服务
50+阅读 · 2024年5月25日
大型语言模型与智能机器人集成的综述
专知会员服务
69+阅读 · 2024年4月22日
多模态人机交互综述
专知会员服务
148+阅读 · 2022年7月3日
相关资讯
「知识增强预训练语言模型」最新研究综述
专知
18+阅读 · 2022年11月18日
清华大学:从单体仿生到群体智能
专知
18+阅读 · 2022年2月9日
智能合约的形式化验证方法研究综述
专知
16+阅读 · 2021年5月8日
最新《可解释人工智能》概述,50页ppt
专知
10+阅读 · 2021年3月17日
多模态情绪识别研究综述
专知
24+阅读 · 2020年12月21日
基于深度学习的数据融合方法研究综述
专知
35+阅读 · 2020年12月10日
层级强化学习概念简介
CreateAMind
19+阅读 · 2019年6月9日
【深度学习】深度学习技术发展趋势浅析
产业智能官
11+阅读 · 2019年4月13日
【大数据】大数据参考架构和关键技术(综合)
产业智能官
14+阅读 · 2018年11月22日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员