**2025 年 8 月 7 日,OpenAI 发布《GPT-5 System Card》(下称 Card)。这是一份 50+ 页的“白皮书”——既是模型能力的答卷,也是安全治理的蓝图。相比以往系统卡,GPT-5 在 架构形态、推理范式、安全框架 上都有质的跃迁,足以成为 AI 产品经理、技术决策者与政策观察者的必读材料

**

  • 统一系统架构:GPT-5是一个整合了快速响应模型、深度推理模型和实时路由模型的统一系统,可根据对话类型、复杂度等自动选择最优模型,未来计划整合为单一模型。
  • 安全训练革新:从传统的“硬拒绝”(直接拒绝风险请求)转向“安全完成”(在符合安全政策的前提下最大化有用性),大幅提升双用途场景(如生物、网络安全)的安全性和有用性。
  • 关键能力提升:在减少幻觉( factual errors)、降低谄媚行为(sycophancy)、抵御越狱攻击(jailbreaks)、增强指令层级遵守能力等方面取得显著进步,尤其在健康、多语言处理等领域表现突出。
  • 严格外部评估:通过超过400名外部测试者和专家的红队测试(累计超9000小时),在暴力攻击规划、提示注入等风险场景中验证了安全性,多个外部机构(如Microsoft AI Red Team、Pattern Labs)评估其安全性优于前代模型。
  • 生物与网络安全防护:将GPT-5-thinking列为“高生物与化学风险”等级,实施多层防护措施(模型训练、系统级监控、账户级 enforcement、API访问控制等),并通过第三方红队和政府机构测试验证有效性。

成为VIP会员查看完整内容
1

相关内容

《水域智能平台母舰系统》24页最新手册
专知会员服务
16+阅读 · 6月14日
《OpenAI o1大模型》中英文技术报告,44页pdf
专知会员服务
144+阅读 · 2024年9月15日
《“全球空中作战计划”(GCAP)分析》
专知会员服务
25+阅读 · 2024年7月23日
中文版-英国国防部《竞争时代的防务》76页报告
专知会员服务
51+阅读 · 2022年6月13日
【AI+军事】数字孪生国防白皮书, 96页pdf
专知
29+阅读 · 2022年4月6日
美国“忠诚僚机”项目概念与技术现状
无人机
12+阅读 · 2018年11月1日
美国公开《无人系统综合路线图(2017-2042)》
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
48+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2013年12月31日
Arxiv
171+阅读 · 2023年4月20日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
10+阅读 · 2018年2月17日
Arxiv
13+阅读 · 2018年1月20日
VIP会员
相关基金
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
48+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员