最新，DeepSeek-R1论文登上Nature封面，附83页补充材料 - 专知VIP

会员服务 ·

0

DeepSeek-R1 · Nature ·

最新，DeepSeek-R1论文登上Nature封面，附83页补充材料

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

也就是今年 1 月份 DeepSeek 在 arxiv 公布的论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》。这篇Nature论文通讯作者正是梁文锋。

论文链接：https://www.nature.com/articles/s41586-025-09422-z 在封面的推荐介绍中，Nature 写到：如果训练出的大模型能够规划解决问题所需的步骤，那么它们往往能够更好地解决问题。这种『推理』与人类处理更复杂问题的方式类似，但这对人工智能有极大挑战，需要人工干预来添加标签和注释。在本周的期刊中，DeepSeek 的研究人员揭示了他们如何能够在极少的人工输入下训练一个模型，并使其进行推理。 DeepSeek-R1 模型采用强化学习进行训练。在这种学习中，模型正确解答数学问题时会获得高分奖励，答错则会受到惩罚。结果，它学会了推理——逐步解决问题并揭示这些步骤——更有可能得出正确答案。这使得 DeepSeek-R1 能够自我验证和自我反思，在给出新问题的答案之前检查其性能，从而提高其在编程和研究生水平科学问题上的表现。此外，

https://static-content.springer.com/esm/art%3A10.1038%2Fs41586-025-09422-z/MediaObjects/41586_2025_9422_MOESM1_ESM.pdf

成为VIP会员查看完整内容

1

相关内容

DeepSeek-R1

NeurIPS 2023 论文奖项公布！两篇杰出的主论文！两篇杰出的亚军论文！两篇杰出的数据集和基准轨道论文

NeurIPS 2023 论文奖项公布！两篇杰出的主论文！两篇杰出的亚军论文！两篇杰出的数据集和基准轨道论文

专知会员服务

34+阅读 · 2023年12月12日

2021 ACM博士论文奖公布，两位NeRF提出者获荣誉提名

2021 ACM博士论文奖公布，两位NeRF提出者获荣誉提名

专知会员服务

20+阅读 · 2022年6月5日

【2022新书】经典与量子计算导论，392页pdf

【2022新书】经典与量子计算导论，392页pdf

专知会员服务

75+阅读 · 2022年1月17日

【ACM Computing Surveys】基于会话推荐系统最新长文综述，163篇参考文献

专知会员服务

37+阅读 · 2021年5月25日

一文概览 CVPR2021 最新18篇 Oral 论文

专知会员服务

26+阅读 · 2021年3月7日

TextCNN作者Kim哈佛大学杰出博士论文《自然语言的深度潜变量模型》，185页pdf，Kim将到MIT任助理教授

TextCNN作者Kim哈佛大学杰出博士论文《自然语言的深度潜变量模型》，185页pdf，Kim将到MIT任助理教授

专知会员服务

72+阅读 · 2020年6月10日

最新《Deepfakes：创造与检测》2020综述论文，36页pdf

最新《Deepfakes：创造与检测》2020综述论文，36页pdf

专知会员服务

65+阅读 · 2020年5月15日

【陈天奇】TVM：端到端自动深度学习编译器，244页ppt

【陈天奇】TVM：端到端自动深度学习编译器，244页ppt

专知会员服务

87+阅读 · 2020年5月11日

AAAI2020接受论文列表，1591篇论文目录全集

AAAI2020接受论文列表，1591篇论文目录全集

专知会员服务

100+阅读 · 2020年1月12日

【论文】生成式教学网络:通过学习生成合成训练数据来加速神经结构搜索（Generative Teaching Networks: Accelerating Neural Architecture Search by Learning to Generate Synthetic Training Data）

【论文】生成式教学网络:通过学习生成合成训练数据来加速神经结构搜索（Generative Teaching Networks: Accelerating Neural Architecture Search by Learning to Generate Synthetic Training Data）

专知会员服务

14+阅读 · 2019年11月17日

六篇 CIKM 2019 最新公布的【图神经网络(GNN)】长文论文

六篇 CIKM 2019 最新公布的【图神经网络(GNN)】长文论文

专知

87+阅读 · 2019年10月22日

最新246篇自动化神经网络搜索（NAS）论文，附完整列表PDF下载

最新246篇自动化神经网络搜索（NAS）论文，附完整列表PDF下载

专知

17+阅读 · 2019年9月20日

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

数据派THU

14+阅读 · 2019年6月15日

最新NLP论文阅读列表，包括对话、问答、摘要、翻译等（附资源）

最新NLP论文阅读列表，包括对话、问答、摘要、翻译等（附资源）

THU数据派

11+阅读 · 2019年3月25日

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

人工智能学家

26+阅读 · 2019年2月9日

2018年有意思的几篇GAN论文

2018年有意思的几篇GAN论文

专知

21+阅读 · 2019年1月5日

MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)

MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)

机器之心

25+阅读 · 2018年12月19日

【论文推荐】最新九篇自动问答相关论文—可解释推理网络、上下文知识图谱嵌入、注意力RNN、Multi-Cast注意力网络

【论文推荐】最新九篇自动问答相关论文—可解释推理网络、上下文知识图谱嵌入、注意力RNN、Multi-Cast注意力网络

专知

15+阅读 · 2018年6月29日

网络表示学习领域（NRL/NE）必读论文汇总

网络表示学习领域（NRL/NE）必读论文汇总

AI科技评论

16+阅读 · 2018年2月18日

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（59页PPT）

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（59页PPT）

新智元

16+阅读 · 2018年2月5日

天元数学交流项目“光声与超声联合成像中的相关反演理论及其算法的研究”

国家自然科学基金

1+阅读 · 2017年12月31日

面向大类别的空中手写中英文识别技术研究

国家自然科学基金

1+阅读 · 2017年12月31日

拓扑非线性分析专题讲习班

国家自然科学基金

15+阅读 · 2016年12月31日

ONSET图像数据统计重建关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

汉英篇章衔接对齐资源构建与分析研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于GIS “胡焕庸线”以西人口增量空间分布与环境承载力研究

国家自然科学基金

1+阅读 · 2015年12月31日

PPP项目争端谈判及其治理机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

中英文论文中的中国作者姓名消歧研究

国家自然科学基金

0+阅读 · 2014年12月31日

企业内正式与非正式网络互动及其对组织适应性影响和权变机理研究：CAS视角的分析

国家自然科学基金

1+阅读 · 2014年12月31日

LncRNA-miRNA相互对话调控脑缺血后血管新生及其机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

A Survey on Statistical Theory of Deep Learning: Approximation, Training Dynamics, and Generative Models

Arxiv

14+阅读 · 2024年1月14日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

84+阅读 · 2023年4月4日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

148+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

62+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

79+阅读 · 2023年3月26日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

Recommender systems based on graph embedding techniques: A comprehensive review

Arxiv

23+阅读 · 2021年9月20日

Deep learning for cardiac image segmentation: A review

Deep learning for cardiac image segmentation: A review

Arxiv

21+阅读 · 2019年11月9日

Deep LOGISMOS: Deep Learning Graph-based 3D Segmentation of Pancreatic Tumors on CT scans

Arxiv

13+阅读 · 2018年1月25日

VIP会员

相关主题

相关VIP内容

NeurIPS 2023 论文奖项公布！两篇杰出的主论文！两篇杰出的亚军论文！两篇杰出的数据集和基准轨道论文

NeurIPS 2023 论文奖项公布！两篇杰出的主论文！两篇杰出的亚军论文！两篇杰出的数据集和基准轨道论文

专知会员服务

34+阅读 · 2023年12月12日

2021 ACM博士论文奖公布，两位NeRF提出者获荣誉提名

2021 ACM博士论文奖公布，两位NeRF提出者获荣誉提名

专知会员服务

20+阅读 · 2022年6月5日

【2022新书】经典与量子计算导论，392页pdf

【2022新书】经典与量子计算导论，392页pdf

专知会员服务

75+阅读 · 2022年1月17日

【ACM Computing Surveys】基于会话推荐系统最新长文综述，163篇参考文献

专知会员服务

37+阅读 · 2021年5月25日

一文概览 CVPR2021 最新18篇 Oral 论文

专知会员服务

26+阅读 · 2021年3月7日

TextCNN作者Kim哈佛大学杰出博士论文《自然语言的深度潜变量模型》，185页pdf，Kim将到MIT任助理教授

TextCNN作者Kim哈佛大学杰出博士论文《自然语言的深度潜变量模型》，185页pdf，Kim将到MIT任助理教授

专知会员服务

72+阅读 · 2020年6月10日

最新《Deepfakes：创造与检测》2020综述论文，36页pdf

最新《Deepfakes：创造与检测》2020综述论文，36页pdf

专知会员服务

65+阅读 · 2020年5月15日

【陈天奇】TVM：端到端自动深度学习编译器，244页ppt

【陈天奇】TVM：端到端自动深度学习编译器，244页ppt

专知会员服务

87+阅读 · 2020年5月11日

AAAI2020接受论文列表，1591篇论文目录全集

AAAI2020接受论文列表，1591篇论文目录全集

专知会员服务

100+阅读 · 2020年1月12日

【论文】生成式教学网络:通过学习生成合成训练数据来加速神经结构搜索（Generative Teaching Networks: Accelerating Neural Architecture Search by Learning to Generate Synthetic Training Data）

【论文】生成式教学网络:通过学习生成合成训练数据来加速神经结构搜索（Generative Teaching Networks: Accelerating Neural Architecture Search by Learning to Generate Synthetic Training Data）

专知会员服务

14+阅读 · 2019年11月17日

热门VIP内容

开通专知VIP会员享更多权益服务

最新，DeepSeek-R1论文登上Nature封面，附83页补充材料

人工智能与未来战争

自动驾驶中的轨迹预测大型基础模型：全面综述

万字长文《对抗雷达系统的电子战综述》

相关资讯

六篇 CIKM 2019 最新公布的【图神经网络(GNN)】长文论文

六篇 CIKM 2019 最新公布的【图神经网络(GNN)】长文论文

专知

87+阅读 · 2019年10月22日

最新246篇自动化神经网络搜索（NAS）论文，附完整列表PDF下载

最新246篇自动化神经网络搜索（NAS）论文，附完整列表PDF下载

专知

17+阅读 · 2019年9月20日

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

数据派THU

14+阅读 · 2019年6月15日

最新NLP论文阅读列表，包括对话、问答、摘要、翻译等（附资源）

最新NLP论文阅读列表，包括对话、问答、摘要、翻译等（附资源）

THU数据派

11+阅读 · 2019年3月25日

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

人工智能学家

26+阅读 · 2019年2月9日

2018年有意思的几篇GAN论文

2018年有意思的几篇GAN论文

专知

21+阅读 · 2019年1月5日

MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)

MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)

机器之心

25+阅读 · 2018年12月19日

【论文推荐】最新九篇自动问答相关论文—可解释推理网络、上下文知识图谱嵌入、注意力RNN、Multi-Cast注意力网络

【论文推荐】最新九篇自动问答相关论文—可解释推理网络、上下文知识图谱嵌入、注意力RNN、Multi-Cast注意力网络

专知

15+阅读 · 2018年6月29日

网络表示学习领域（NRL/NE）必读论文汇总

网络表示学习领域（NRL/NE）必读论文汇总

AI科技评论

16+阅读 · 2018年2月18日

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（59页PPT）

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（59页PPT）

新智元

16+阅读 · 2018年2月5日

相关基金

天元数学交流项目“光声与超声联合成像中的相关反演理论及其算法的研究”

国家自然科学基金

1+阅读 · 2017年12月31日

面向大类别的空中手写中英文识别技术研究

国家自然科学基金

1+阅读 · 2017年12月31日

拓扑非线性分析专题讲习班

国家自然科学基金

15+阅读 · 2016年12月31日

ONSET图像数据统计重建关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

汉英篇章衔接对齐资源构建与分析研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于GIS “胡焕庸线”以西人口增量空间分布与环境承载力研究

国家自然科学基金

1+阅读 · 2015年12月31日

PPP项目争端谈判及其治理机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

中英文论文中的中国作者姓名消歧研究

国家自然科学基金

0+阅读 · 2014年12月31日

企业内正式与非正式网络互动及其对组织适应性影响和权变机理研究：CAS视角的分析

国家自然科学基金

1+阅读 · 2014年12月31日

LncRNA-miRNA相互对话调控脑缺血后血管新生及其机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

A Survey on Statistical Theory of Deep Learning: Approximation, Training Dynamics, and Generative Models

Arxiv

14+阅读 · 2024年1月14日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

84+阅读 · 2023年4月4日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

148+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

62+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

79+阅读 · 2023年3月26日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

Recommender systems based on graph embedding techniques: A comprehensive review

Arxiv

23+阅读 · 2021年9月20日

Deep learning for cardiac image segmentation: A review

Deep learning for cardiac image segmentation: A review

Arxiv

21+阅读 · 2019年11月9日

Deep LOGISMOS: Deep Learning Graph-based 3D Segmentation of Pancreatic Tumors on CT scans

Arxiv

13+阅读 · 2018年1月25日

微信扫码咨询专知VIP会员