直播实录 | AlphaGo Zero是如何实现无师自通的？

2017 年 10 月 31 日 PaperWeekly 让你更懂AI的

本文为 10 月 29 日，圣何塞州立大学——刘遥行的论文共读直播分享实录。

Google DeepMind 团队在 Nature 上发表的最新论文，阐述了新版 AlphaGo 是如何从空白状态学起，不使用任何人类棋谱，通过自对弈强化学习，仅用 3 天训练时间就以 100:0 击败了上一版本的 AlphaGo，并用 21 天达到 AlphaGo Master 水平。

AlphaGo Zero 的核心在于强化学习下的自我博弈。本期论文共读，我们邀请到深入浅出看懂AlphaGo Zero 一文的作者，圣何塞州立大学研究生刘遥行，带大家揭秘 AlphaGo 的前世今生。

>>>>

获取完整PPT

关注“PaperWeekly”微信公众号，回复“20171029”获取下载链接。

直播实录

AlphaGo Zero是如何实现无师自通的？

AlphaGo Zero

论文解读√在线讨论√

活动形式：语音直播

活动时间

10 月 29 日（周日）13:00-14:15

45 min 串讲 + 30 min 讨论

长按识别二维码观看实录

*报名成功后，即可进入直播间回看实录

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 回看实录

登录查看更多

相关内容

AlphaGo Zero

关注 13

AlphaGo Zero是谷歌下属公司Deepmind的新版程序。从空白状态学起，在无任何人类输入的条件下，AlphaGo Zero能够迅速自学围棋，并以100:0的战绩击败“前辈”。 2017年10月19日凌晨，在国际学术期刊《自然》（Nature）上发表的一篇研究论文中，谷歌下属公司Deepmind报告新版程序AlphaGo Zero：从空白状态学起，在无任何人类输入的条件下，它能够迅速自学围棋，并以100:0的战绩击败“前辈”。Deepmind的论文一发表，TPU的销量就可能要大增了。其100:0战绩有“造”真嫌疑。

【DeepMind硬核课】卷积神经网络图像识别前沿进展，附110页ppt与视频

专知会员服务

105+阅读 · 2020年6月27日

FPGA加速系统开发工具设计:综述与实践

专知会员服务

69+阅读 · 2020年6月24日

机器学习如何用于芯片系统设计？Jeff Dean推荐Google最新《机器学习系统芯片设计》70页ppt为你讲解

专知会员服务

61+阅读 · 2020年5月31日

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

专知会员服务

112+阅读 · 2020年5月15日