业界 | DeepMind发布AlphaGo 50局自我对弈棋谱

2017 年 5 月 29 日 机器之心

选自DeepMind

机器之心编译

参与:机器之心编辑部


5 月 27 日,升级后的 AlphaGo 所向披靡,最终以 3:0 赢下了乌镇围棋人机大战。在此期间,机器之心除了现场报道之外,还邀请了阿尔伯塔大学教授、计算机围棋顶级专家 Martin Müller(也是机器之心 GMIS 2017 大会的演讲嘉宾)和《深度强化学习综述》论文作者李玉喜博士,共同观看了比赛直播。这两位学界专家也分享了很多精彩点评,详情可参阅机器之心的系列报道:



最后一场比赛结束后,DeepMind 正式宣布 AlphaGo 退出围棋竞技赛,将把 AlphaGo 打造成为学习围棋的工具;并将陆续公开 50 局自我对弈棋局。今日早些时候,DeepMind 如其承诺地那样完全公布了 50 局对弈棋谱。在这 50 局对弈中,白棋获胜 38 局,而黑棋仅获胜 12 局;如果这 50 局对弈棋谱是随机选择的,那么可能说明 AlphaGo 目前所采用的中国规则偏向白棋。这 50 局棋谱在 DeepMind 官网上以交互式的方式呈现。


全部棋谱请访问原网页查阅:https://deepmind.com/research/alphago/alphago-vs-alphago-self-play-games


在宣布发布这些棋谱的文章中,DeepMind 写道:


在乌镇围棋峰会比赛结束后,DeepMind 决定向围棋爱好者和全世界们献上又一个礼物。在去年与李世石的五番棋之后,AlphaGo 就一直以自我训练为主,它在一年多的时间里进行了数以百万计的高水平自我对局,并在这个过程中不断提升自己。今天,我们公布了 50 盘 AlphaGo 自我对弈棋局。这些对局采用常规时间限制,中国规则,DeepMind 相信,这些对局可以为人类棋手们带来新的启发。


DeepMind 成功利用这次人机围棋大战的机会,已向少数顶级棋手展示了一些棋谱。九段棋手&世界围棋冠军时越说:「AlphaGo 自我对弈的棋谱大异于我所见过的任何其他棋谱,它们正是我想要的未来围棋。」九段棋手&世界围棋冠军古力说:「这些自我对弈的棋谱令人难以置信,受益匪浅。」我们表示希望围棋手通过这些棋谱小试身手。


第1盘棋谱


第41盘棋谱



更多有关GMIS 2017大会的内容,请点击「阅读原文」查看机器之心官网 GMIS 专题↓↓↓

登录查看更多
0

相关内容

AlphaGo 是一款人工智能围棋程序,由被 Google 收购的 DeepMind 公司开发。 2015年10月,AlphaGo v13 在与职业棋手、欧洲冠军 樊麾二段 的五番棋比赛中,以 5:0 获胜。2016年3月9日 - 15日,AlphaGo v18 在与韩国职业棋手 李世石九段 的五番棋比赛中,以 4:1 获胜,赛后,AlphaGo 荣获韩国棋院授予的「第〇〇一号 名誉九段」证书。2016年7月19日,AlphaGo 在 GoRantings 世界围棋排名中超过柯洁,成为世界第一。
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
169+阅读 · 2020年2月8日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
MIT新书《强化学习与最优控制》
专知会员服务
270+阅读 · 2019年10月9日
一张图看懂AlphaGo Zero
AI前线
5+阅读 · 2017年11月17日
Accelerated Methods for Deep Reinforcement Learning
Arxiv
6+阅读 · 2019年1月10日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
Arxiv
11+阅读 · 2018年4月25日
Arxiv
7+阅读 · 2018年3月21日
VIP会员
Top
微信扫码咨询专知VIP会员