近几年, 计算机围棋成功引发了又一轮的人工智能热潮, 从计算机围棋中发展出来的AlphaZero框架成功地应用在其他完全信息条件下的二人有限零和博弈问题, 进而展示出了深度学习和强化学习在智能决策领域的优异性能。本文首先介绍了AlphaZero框架中三个核心技术: 深度学习、 强化学习以及蒙特卡罗树搜索, 然后详细说明了AlphaZero框架两个关键阶段——AlphaGo和AlphaGo Zero的基本原理, 最后, 对AlphaZero框架提出了自己的思考, 并基于对AlphaZero原理的剖析讨论了其对军事决策智能化的启示。

http://www.aeroweaponry.avic.com/CN/abstract/abstract10638.shtml

成为VIP会员查看完整内容
30

相关内容

元自步学习
专知会员服务
32+阅读 · 2020年9月4日
生成对抗网络GAN的发展与最新应用
专知会员服务
124+阅读 · 2020年8月13日
基于改进卷积神经网络的短文本分类模型
专知会员服务
25+阅读 · 2020年7月22日
对抗样本生成技术综述
专知会员服务
62+阅读 · 2020年7月21日
深度学习批归一化及其相关算法研究进展
专知会员服务
49+阅读 · 2020年7月17日
多智能体深度强化学习的若干关键科学问题
专知会员服务
172+阅读 · 2020年5月24日
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
106+阅读 · 2020年5月15日
人机对抗智能技术
专知会员服务
188+阅读 · 2020年5月3日
轻量级神经网络架构综述
专知会员服务
95+阅读 · 2020年4月29日
【学界】DeepMind论文:深度压缩感知,新框架提升GAN性能
GAN生成式对抗网络
14+阅读 · 2019年5月23日
DeepMind论文:深度压缩感知,新框架提升GAN性能
极市平台
4+阅读 · 2019年5月23日
AlphaZero 实战:从零学下五子棋(附代码)
AI研习社
3+阅读 · 2018年1月13日
一张图看懂AlphaGo Zero
AI前线
5+阅读 · 2017年11月17日
【原理】GAN的数学原理
GAN生成式对抗网络
8+阅读 · 2017年8月30日
SAR成像原理及图像鉴赏
无人机
20+阅读 · 2017年8月14日
最大熵原理(一)
深度学习探索
12+阅读 · 2017年8月3日
AutoML: A Survey of the State-of-the-Art
Arxiv
67+阅读 · 2019年8月14日
Parsimonious Bayesian deep networks
Arxiv
5+阅读 · 2018年10月17日
Arxiv
11+阅读 · 2018年1月15日
VIP会员
相关主题
相关VIP内容
元自步学习
专知会员服务
32+阅读 · 2020年9月4日
生成对抗网络GAN的发展与最新应用
专知会员服务
124+阅读 · 2020年8月13日
基于改进卷积神经网络的短文本分类模型
专知会员服务
25+阅读 · 2020年7月22日
对抗样本生成技术综述
专知会员服务
62+阅读 · 2020年7月21日
深度学习批归一化及其相关算法研究进展
专知会员服务
49+阅读 · 2020年7月17日
多智能体深度强化学习的若干关键科学问题
专知会员服务
172+阅读 · 2020年5月24日
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
106+阅读 · 2020年5月15日
人机对抗智能技术
专知会员服务
188+阅读 · 2020年5月3日
轻量级神经网络架构综述
专知会员服务
95+阅读 · 2020年4月29日
相关资讯
【学界】DeepMind论文:深度压缩感知,新框架提升GAN性能
GAN生成式对抗网络
14+阅读 · 2019年5月23日
DeepMind论文:深度压缩感知,新框架提升GAN性能
极市平台
4+阅读 · 2019年5月23日
AlphaZero 实战:从零学下五子棋(附代码)
AI研习社
3+阅读 · 2018年1月13日
一张图看懂AlphaGo Zero
AI前线
5+阅读 · 2017年11月17日
【原理】GAN的数学原理
GAN生成式对抗网络
8+阅读 · 2017年8月30日
SAR成像原理及图像鉴赏
无人机
20+阅读 · 2017年8月14日
最大熵原理(一)
深度学习探索
12+阅读 · 2017年8月3日
微信扫码咨询专知VIP会员