深度强化学习入门:用TensorFlow构建你的第一个游戏AI丨数据工匠简报

2017 年 11 月 20 日 Datartisan数据工匠

点击上方

Datartisan数据工匠

可以订阅哦!

page
1

深度强化学习入门:用TensorFlow构建你的第一个游戏AI

本文通过一种简单的 Catch 游戏介绍了深度强化学习的基本原理,并给出了完整的以 Keras 为前端的 TensorFlow 代码实现,是入门深度强化学习的不错选择。


去年,DeepMind 的 AlphaGo 以 4-1 的比分打败了世界围棋冠军李世乭。超过 2 亿的观众就这样看着强化学习(reinforce learning)走上了世界舞台。几年前,DeepMind 制作了一个可以玩 Atari 游戏的机器人,引发轩然大波。此后这个公司很快被谷歌收购。


很多研究者相信,强化学习是我们创造通用人工智能(Artificial General Intelligence)的最佳手段。这是一个令人兴奋的领域,有着许多未解决的挑战和巨大的潜能。


强化学习起初看似非常有挑战性,但其实要入门并不困难。在这篇文章中,我们将创造一个基于 Keras 的简单机器人,使它能玩 Catch 游戏。

扫码阅读原文


page

2

谈谈比特币分叉

今天说一个新概念,比特币分叉


什么是比特币分叉,我之前讲过,比特币的价值来自于共识,那么,比特币分叉,简单说就是共识分裂,为什么共识会分裂。


具体很多技术概念,不展开了,不只是怕你们不懂,实话实说,我也不是很懂,我就说咱们都能懂的。


比特币最开始的设计,本来区块大小是可以很大的,但为了防范某些攻击行为,就强行把区块大小限制为1M左右,但现在问题来了,比特币的市值越来越高,而比特币有一个特性,可以无限切割,一般货币最小单位是1分钱,比特币可以0.001,0.0001这样无限切割交易,所以,理论上,它的交易粒度是可以非常非常细碎的。那么现有的架构,其交易效率和支撑能力已经越来越无法满足比特币的蓬勃发展,所以,如果比特币市值继续提升,应用场景继续提升,现有的技术架构肯定是难堪重荷,想想当年谁能预料比特币这么值钱呢。


所以,做架构升级,实现系统的支撑性扩容,成为一项紧迫任务,也是所有相关币圈各种核心团队,包括矿池,包括核心开发团队,包括交易所,都非常关注的一个事情,于是他们坐在一起开了个闭门会议(是的,被你们猜对了,我并没有被邀请),讨论这个事情怎么办,然后几个主流矿池都签了协议,支持某个升级计划,按说,这事本身就是一个系统升级和扩容的话题,虽然技术可能有点深奥,但业务逻辑并不复杂。

扫码阅读原文


page

3

GitHub 上 10 月份最火的开源项目

今天我们将继续介绍 GitHub 上 10 月份最受欢迎的 10 个开源项目,本月榜单中,前端项目的占比相对大点,一起来看看这些项目中,你有在用或用过哪些呢?


1JavaScript 运行环境 Napa.js

Napa.js 是微软开源的一个基于 V8 的多线程 JavaScript 运行环境。它最初被设计用于在 Bing 中开发不影响性能的高度迭代服务, 随着发展,Napa.js 被发现在 CPU-bound 任务中能有效补充 Node.js ,具备在多个 V8 隔离中执行 JavaScript 并在它们之间进行通信的能力。 Napa.js 作为一个 Node.js 的模块公开,它也可以嵌入到没有 Node.js 依赖关系的主机进程中。


概括来讲,Node.js 是异步的,JS 代码执行和事件通知运行在一个线程中,JS 代码中的耗时操作会挤占事件轮询的 CPU 时间。Napa.js 的出现,很好的对这个缺陷进行了补充,将 JS 执行和事件轮询拆分到不同的线程中。


2开源操作系统 cosmos

使用 C# 开发基于.net framework 的开源操作系统.Cosmos 的源代码使用 C# 来编写,先把源代码编译成IL中间语言,然后再由专门针对该项目编写的编译器 IL2CPU 来把编译好的IL源代码转换成本地机器码

扫码阅读原文


更多课程和文章尽在微信号

「datartisan数据工匠」


登录查看更多
7

相关内容

深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。 传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而,传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下,深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。
【圣经书】《强化学习导论(2nd)》电子书与代码,548页pdf
专知会员服务
197+阅读 · 2020年5月22日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
136+阅读 · 2020年3月1日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
169+阅读 · 2020年2月8日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
TensorFlow 2.0深度强化学习指南
云栖社区
18+阅读 · 2019年2月1日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
26+阅读 · 2018年8月17日
令人困惑的TensorFlow!
机器之心
4+阅读 · 2018年7月2日
深度强化学习的弱点和局限
论智
6+阅读 · 2018年2月27日
深度强化学习的弱点和局限(上)
论智
8+阅读 · 2018年2月26日
强化学习的入门之旅
机器学习研究会
6+阅读 · 2018年2月12日
【深度强化学习】深度强化学习揭秘
产业智能官
20+阅读 · 2017年11月13日
One-Shot Federated Learning
Arxiv
9+阅读 · 2019年3月5日
Arxiv
5+阅读 · 2018年6月5日
Arxiv
11+阅读 · 2018年4月25日
VIP会员
相关VIP内容
【圣经书】《强化学习导论(2nd)》电子书与代码,548页pdf
专知会员服务
197+阅读 · 2020年5月22日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
136+阅读 · 2020年3月1日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
169+阅读 · 2020年2月8日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
相关资讯
TensorFlow 2.0深度强化学习指南
云栖社区
18+阅读 · 2019年2月1日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
26+阅读 · 2018年8月17日
令人困惑的TensorFlow!
机器之心
4+阅读 · 2018年7月2日
深度强化学习的弱点和局限
论智
6+阅读 · 2018年2月27日
深度强化学习的弱点和局限(上)
论智
8+阅读 · 2018年2月26日
强化学习的入门之旅
机器学习研究会
6+阅读 · 2018年2月12日
【深度强化学习】深度强化学习揭秘
产业智能官
20+阅读 · 2017年11月13日
相关论文
One-Shot Federated Learning
Arxiv
9+阅读 · 2019年3月5日
Arxiv
5+阅读 · 2018年6月5日
Arxiv
11+阅读 · 2018年4月25日
Top
微信扫码咨询专知VIP会员