推理语言模型论文 - 专知

会员服务 ·

推理语言模型

推理语言模型

Efficient Reasoning for Large Reasoning Language Models via Certainty-Guided Reflection Suppression

Arxiv

0+阅读 · 11月17日

Explore Data Left Behind in Reinforcement Learning for Reasoning Language Models

Arxiv

0+阅读 · 11月6日

On the Interplay of Pre-Training, Mid-Training, and RL on Reasoning Language Models

Arxiv

0+阅读 · 12月8日

参考链接

微信扫码咨询专知VIP会员