报名 | AlphaGo Zero是如何实现无师自通的？

2017 年 10 月 27 日 机器之心

「论文共读」是由 PaperWeekly 发起的协同阅读小组。我们每周精选一篇优质好文，由学术大咖带大家解读论文并展开讨论，在碎片化时代坚持深度阅读。

Google DeepMind 团队在 Nature 上发表的最新论文，阐述了新版 AlphaGo 是如何从空白状态学起，不使用任何人类棋谱，通过自对弈强化学习，仅用 3 天训练时间就以 100:0 击败了上一版本的 AlphaGo，并用 21 天达到 AlphaGo Master 水平。

AlphaGo Zero 的核心在于强化学习下的自我博弈。本期论文共读，我们邀请到深入浅出看懂 AlphaGo Zero 一文的作者，圣何塞州立大学研究生刘遥行，带大家揭秘 AlphaGo 的前世今生。

论文介绍

Mastering the Game of Go without Human Knowledge

@PaperWeekly 推荐

#Deep Reinforcement Learning

DeepMind 最新成果，无师自通下围棋。

论文链接

http://www.paperweekly.site/papers/942

嘉宾介绍

刘遥行，圣何塞州立大学研究生，幕布（mubu.com）实习生，关注人工智能和现实生活的工业结合、人工智能和区块链技术的联合应用。

论文共读

AlphaGo Zero 是如何实现无师自通的？

AlphaGo Zero

论文解读√在线讨论√

活动形式：语音直播

活动时间

10 月 29 日（周日）13:00-14:15

45 min 串讲 + 30 min 讨论

* 请在活动开始前完成论文精读

长按识别二维码，马上报名

* 报名成功后，关注系统弹出的公众号获取活动提醒

往期回顾

“阳奉阴违” 的半监督学习算法 - Virtual Adversarial Training

关于 PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 进行报名

登录查看更多

相关内容

AlphaGo Zero

关注 13

AlphaGo Zero是谷歌下属公司Deepmind的新版程序。从空白状态学起，在无任何人类输入的条件下，AlphaGo Zero能够迅速自学围棋，并以100:0的战绩击败“前辈”。 2017年10月19日凌晨，在国际学术期刊《自然》（Nature）上发表的一篇研究论文中，谷歌下属公司Deepmind报告新版程序AlphaGo Zero：从空白状态学起，在无任何人类输入的条件下，它能够迅速自学围棋，并以100:0的战绩击败“前辈”。Deepmind的论文一发表，TPU的销量就可能要大增了。其100:0战绩有“造”真嫌疑。

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

专知会员服务

111+阅读 · 2020年6月10日

AI领域顶会AAMAS2020最佳论文出炉!《深度残差强化学习》牛津大学，Deep Residual RL

专知会员服务

45+阅读 · 2020年5月15日

一份循环神经网络RNNs简明教程，37页ppt

专知会员服务

173+阅读 · 2020年5月6日

【硬核书】数学博弈论与应用，431页pdf，Mathematical Game Theory and Applications

专知会员服务

170+阅读 · 2020年4月18日