近年来,渊亭科技积极参与行业内大模型的各项能力评估建设,取得了突出成果。作为国内最早从事军事大模型建设的企业之一,渊亭科技凭借在军事智能化领域的深厚积累,重磅推出《军事大模型评估体系白皮书》。

**

**

**

**

白皮书全面地梳理了军事大模型能力评估的行业特殊性和关注要素,并按照评估框架、评估标准、评估手段、评估数据、评估工具、评估平台等6大方向,系统性阐述了军事大模型评估过程中的最佳实践,预期能为行业内开展军事大模型的能力评估提供体系化的参考。

其中,评估框架以架构能力、基础能力、平台能力、应用能力、安全能力等5大能力为基石,深入探讨了大模型评估的具体方法。

**架构能力:**围绕大模型应用系统,在准确性、健壮性、兼容性;可解释、可评估、可伸缩;高扩展、高可用、高运维角度进行全面阐述。

**基础能力:**通用基础能力集成行业主流的通用评估方法,军事基础能力提供针对军事特性的领域评估手段。通过贯通评测任务构建-评测执行-评测结果分析-评测报告生成,定义高度自动的基础能力评估工具集。

**平台能力:**针对大模型开发、训练和部署基础平台,对数据生成、开发训练、应用编排、会话管理等关键能力进行全面性和效果评估。

**应用能力:**提炼强敌研究、指挥作战、装备研制、训练管理、联勤保障等方向的典型应用场景,定义针对场景的标准评估手段,结合业务特性快速实施评估。

**安全能力:**设计面向对抗攻击、内容伪造、数据泄露等方向的评估手段,综合评估大模型的安全性和可靠性。

成为VIP会员查看完整内容
128

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《计算机辅助军事实验》
专知会员服务
33+阅读 · 2月5日
《支持大规模作战行动的战术反情报工作》
专知会员服务
24+阅读 · 2023年5月28日
军事领域体系结构研究综述
专知会员服务
114+阅读 · 2023年4月27日
《军事背景下能力规划的概念模型》
专知会员服务
118+阅读 · 2023年3月28日
深度学习研究及军事应用综述
专知
14+阅读 · 2022年7月7日
【AI+军事】数字孪生国防白皮书, 96页pdf
专知
25+阅读 · 2022年4月6日
国家自然科学基金
6+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
28+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
33+阅读 · 2013年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
国家自然科学基金
29+阅读 · 2008年12月31日
Arxiv
142+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
348+阅读 · 2023年3月31日
Arxiv
59+阅读 · 2023年3月26日
Arxiv
123+阅读 · 2023年3月24日
Arxiv
18+阅读 · 2023年3月17日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
6+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
28+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
33+阅读 · 2013年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
国家自然科学基金
29+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员