这本开放存取书主要关注机器人的安全控制。控制方案主要基于动态神经网络,它是深度强化学习的一个重要理论分支。为提高机器人系统的安全性能,控制策略包括模型不确定性机器人的自适应跟踪控制、不确定性环境的顺应性控制、动态工作空间的避障控制。这本书关于解决机器手臂安全控制的想法是在工业应用和实验室的研究讨论中构想出来的。这本书中的大部分材料来源于作者在期刊上发表的论文,如IEEE工业电子学报、神经计算等。

本书可以作为机器人系统和人工智能控制器的研究者和设计者的参考书,也可以作为高校本科高年级和研究生的参考书。

成为VIP会员查看完整内容
0
18

相关内容

人工智能(Artificial Intelligence, AI )是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支。

这本书介绍了金融中的机器学习方法。它为量化金融提出了一个统一的处理机器学习和各种统计计算学科,如金融计量经济学和离散时间随机控制,并强调为金融数据建模和决策如何进行理论和假设检验做出算法的选择。随着计算资源和数据集的增加,机器学习已经成为金融业的一项重要技能。这本书是为在金融计量经济学,金融数学和应用统计学的高级研究生和学者写的,此外还包括在定量金融领域的定量和数据科学家。

金融中的机器学习:从理论到实践分为三个部分,每个部分包括理论和应用。第一篇从贝叶斯和频率论的角度介绍了对横断面数据的监督学习。更高级的材料强调神经网络,包括深度学习,以及高斯过程,在投资管理和衍生建模的例子。第二部分介绍了时间序列数据的监督学习,这是金融领域最常用的数据类型,并举例说明了交易、随机波动和固定收益模型。最后,第三部分介绍了强化学习及其在交易、投资和财富管理中的应用。还提供了Python代码示例,以支持读者对方法和应用的理解。这本书还包括超过80个数学和编程练习例子,与工作的解决方案可提供给教师。作为这一新兴领域研究的桥梁,最后一章从研究人员的角度介绍了金融机器学习的前沿,强调了统计物理中有多少众所周知的概念可能会作为金融机器学习的重要方法出现。

https://www.springer.com/gp/book/9783030410674

代码: https://github.com/mfrdixon/ML_Finance_Codes

成为VIP会员查看完整内容
2
80

最新的技术进步提高了交通运输的质量。新的数据驱动方法为所有基于控制的系统(如交通、机器人、物联网和电力系统)带来了新的研究方向。将数据驱动的应用与运输系统相结合在最近的运输应用程序中起着关键的作用。本文综述了基于深度强化学习(RL)的交通控制的最新应用。其中,详细讨论了基于深度RL的交通信号控制(TSC)的应用,这在文献中已经得到了广泛的研究。综合讨论了TSC的不同问题求解方法、RL参数和仿真环境。在文献中,也有一些基于深度RL模型的自主驾驶应用研究。我们的调查广泛地总结了这一领域的现有工作,并根据应用程序类型、控制模型和研究的算法对它们进行了分类。最后,我们讨论了基于深度可编程逻辑语言的交通应用所面临的挑战和有待解决的问题。

成为VIP会员查看完整内容
0
62

决策理论是现代人工智能和经济学的基础。本课程主要从统计学的角度,也从哲学的角度,为决策理论打下坚实的基础。本课程有两个目的:

  • 深入了解统计决策理论、实验设计的自动化方法,并将其与人类决策联系起来。
  • 通过开发算法和智能代理的实验,将该理论应用到强化学习和人工智能的实际问题中。

课程可分为两部分。

  • 第一部分,我们介绍了主观概率和效用的概念,以及如何用它们来表示和解决决策问题。然后讨论未知参数的估计和假设检验。最后,我们讨论了顺序抽样、顺序实验,以及更一般的顺序决策。

  • 第二部分是不确定性下的决策研究,特别是强化学习和专家咨询学习。首先,我们研究几个有代表性的统计模型。然后,我们给出了使用这些模型做出最优决策的算法的概述。最后,我们来看看学习如何根据专家的建议来行动的问题,这个领域最近在在线广告、游戏树搜索和优化方面有很多应用。

成为VIP会员查看完整内容
0
85

强化一词来源于实验心理学中对动物学习的研究,它指的是某一事件的发生,与某一反应之间有恰当的关系,而这一事件往往会增加该反应在相同情况下再次发生的可能性。虽然心理学家没有使用“强化学习”这个术语,但它已经被人工智能和工程领域的理论家广泛采用,用来指代基于这一强化原理的学习任务和算法。最简单的强化学习方法使用的是一个常识,即如果一个行为之后出现了一个令人满意的状态,或者一个状态的改善,那么产生该行为的倾向就会得到加强。强化学习的概念在工程领域已经存在了几十年(如Mendel和McClaren 1970),在人工智能领域也已经存在了几十年(Minsky 1954, 1961;撒母耳1959;图灵1950)。然而,直到最近,强化学习方法的发展和应用才在这些领域占据了大量的研究人员。激发这种兴趣的是两个基本的挑战:1) 设计能够在复杂动态环境中在不确定性下运行的自主机器人代理,2) 为非常大规模的动态决策问题找到有用的近似解。

成为VIP会员查看完整内容
0
118

论文题目:Acquiring Diverse Robot Skills via Maximum Entropy Deep Reinforcement Learning

作者:Tuomas Haarnoja

导师:Pieter Abbeel and Sergey Levine

网址:
https://www2.eecs.berkeley.edu/Pubs/TechRpts/2018/EECS-2018-176.html

论文摘要:

在本文中,我们研究了最大熵框架如何提供有效的深度强化学习(deep reinforcement learning, deep RL)算法,以连贯性地解决任务并有效地进行样本抽取。这个框架有几个有趣的特性。首先,最优策略是随机的,改进了搜索,防止了收敛到局部最优,特别是当目标是多模态的时候。其次,熵项提供了正则化,与确定性方法相比,具有更强的一致性和鲁棒性。第三,最大熵策略是可组合的,即可以组合两个或两个以上的策略,并且所得到的策略对于组成任务奖励的总和是近似最优的。第四,最大熵RL作为概率推理的观点为构建能够解决复杂和稀疏奖励任务的分层策略提供了基础。在第一部分中,我们将在此基础上设计新的算法框架,从soft Q学习的学习表现力好的能量策略、对于 sodt actor-critic提供简单和方便的方法,到温度自动调整策略, 几乎不需要hyperparameter调优,这是最重要的一个实际应用的调优hyperparameters可以非常昂贵。在第二部分中,我们将讨论由最大熵策略固有的随机特性所支持的扩展,包括组合性和层次学习。我们将演示所提出的算法在模拟和现实机器人操作和移动任务中的有效性。

成为VIP会员查看完整内容
0
25
小贴士
相关VIP内容
专知会员服务
31+阅读 · 1月28日
专知会员服务
47+阅读 · 2020年12月19日
专知会员服务
69+阅读 · 2020年10月24日
专知会员服务
111+阅读 · 2020年6月24日
专知会员服务
118+阅读 · 2020年4月19日
专知会员服务
48+阅读 · 2020年3月2日
相关资讯
深度学习技术在自动驾驶中的应用
智能交通技术
13+阅读 · 2019年10月27日
自动驾驶技术解读——自动驾驶汽车决策控制系统
智能交通技术
13+阅读 · 2019年7月7日
【CPS】信息物理融合系统理论与应用专刊序言
产业智能官
4+阅读 · 2019年2月27日
【智能控制】中国智能控制40年
产业智能官
3+阅读 · 2018年11月28日
【机器人】机器人PID控制
产业智能官
7+阅读 · 2018年11月25日
【人工智能】人工智能的应用边界
产业智能官
3+阅读 · 2018年1月9日
李克强:智能车辆运动控制研究综述
厚势
8+阅读 · 2017年10月17日
相关论文
Jackson Morris,Fang Song
0+阅读 · 2月14日
Juan D. Gonzalez,Ricardo Maronna,Victor J. Yohai,Ruben H. Zamar
0+阅读 · 2月13日
Eslam Mohamed,Abdelrahman Shaker,Hazem Rashed,Ahmad El-Sallab,Mayada Hadhoud
0+阅读 · 2月12日
Song Wei,Shixiang Zhu,Minghe Zhang,Yao Xie
0+阅读 · 2月12日
Sander Beckers
4+阅读 · 2020年12月10日
Yunfan Li,Peng Hu,Zitao Liu,Dezhong Peng,Joey Tianyi Zhou,Xi Peng
16+阅读 · 2020年9月21日
Liang Yao,Chengsheng Mao,Yuan Luo
6+阅读 · 2019年9月11日
Simultaneous Localization and Mapping (SLAM) using RTAB-MAP
Sagarnil Das
4+阅读 · 2018年9月9日
Learning Blind Video Temporal Consistency
Wei-Sheng Lai,Jia-Bin Huang,Oliver Wang,Eli Shechtman,Ersin Yumer,Ming-Hsuan Yang
3+阅读 · 2018年8月1日
Yue Liu,Tongtao Zhang,Zhicheng Liang,Heng Ji,Deborah L. McGuinness
4+阅读 · 2018年7月10日
Top