精品内容

基于人工反馈的强化学习综述
专知会员服务
56+阅读 · 2023年12月25日
ChatGPT大模型技术发展与应用
专知会员服务
122+阅读 · 2023年12月3日
71页ppt!指令微调和RLHF讲座(NYU CSCI 2590) 附视频
专知会员服务
48+阅读 · 2023年5月20日
【OpenAI-John Schulman】从人类反馈中强化学习:进展与挑战
专知会员服务
61+阅读 · 2023年4月22日
ChatGPT 背后的“功臣”——RLHF 技术详解
专知会员服务
166+阅读 · 2023年2月21日
参考链接
微信扫码咨询专知VIP会员