【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策算法 - 专知

会员服务 ·

0

【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策算法

2021 年 1 月 27 日 专知

hms for solving them.

这本书提供了一个广泛的不确定性决策的算法介绍。我们涵盖了与决策相关的各种主题，介绍了潜在的数学问题公式和解决它们的算法。

本文面向高级本科生、研究生和专业人员。本书要求具有一定的数学基础，并假定预先接触过多变量微积分、线性代数和概率概念。附录中提供了一些复习材料。这本书特别有用的学科包括数学、统计学、计算机科学、航空航天、电气工程和运筹学。

这本教科书的基础是算法，它们都是用Julia编程语言实现的。这本允许免费使用与本书相关的代码片段，条件是必须确认代码的来源。我们预计其他人可能想把这些算法翻译成其他编程语言。随着翻译版本的发布，我们将从该书的网页上链接到它们。

许多重要的问题都涉及不确定性下的决策，包括飞机碰撞避免、灾害管理和灾难反应。在设计自动化决策系统或决策支持系统时，在做出或推荐决策时考虑各种不确定性来源是很重要的。考虑到这些不确定性的来源并仔细平衡系统的多个目标是非常具有挑战性的。我们将从计算的角度讨论这些挑战，旨在提供决策模型和计算方法背后的理论。本章介绍了不确定性下的决策问题，提供了一些应用实例，并概述了可能的计算方法的空间。本章总结了各种学科对我们理解智能决策的贡献，并强调了潜在社会影响的领域。我们以本书其余部分的大纲结束。

https://algorithmsbook.com/

Introduction

PART I: PROBABILISTIC REASONING

Representation
Inference
Parameter Learning
Structure Learning
Simple Decisions

PART II: SEQUENTIAL PROBLEMS

Exact Solution Methods
Approximate Value Functions
Online Planning
Policy Search
Policy Gradient Estimation
Policy Gradient Optimization
Actor-Critic Methods
Policy Validation

PART III: MODEL UNCERTAINTY

Exploration and Exploitation
Model-Based Methods
Model-Free Methods
Imitation Learning

PART IV: STATE UNCERTAINTY

Beliefs
Exact Belief State Planning
Offline Belief State Planning
Online Belief State Planning
Controller Abstractions

PART V: MULTIAGENT SYSTEMS

Multiagent Reasoning
Sequential Problems
State Uncertainty
Collaborative Agents

APPENDICES

A: Mathematical Concepts
B: Probability Distributions
C: Computational Complexity
D: Neural Representations
E: Search Algorithms
F: Problems
G: Julia

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“A694” 可以获取《【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策算法》专知下载链接索引

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

0

相关内容

不确定性决策

不确定性决策

【斯坦福经典书】强化学习在金融应用，414页pdf

【斯坦福经典书】强化学习在金融应用，414页pdf

专知会员服务

127+阅读 · 2021年3月30日

【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策

【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策

专知会员服务

261+阅读 · 2021年1月27日

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

专知会员服务

76+阅读 · 2021年1月23日

【斯坦福】分布式算法与优化，118页pdf

专知会员服务

82+阅读 · 2020年12月22日

【斯坦福干货书】强化学习基金融领域应用，312页pdf

【斯坦福干货书】强化学习基金融领域应用，312页pdf

专知会员服务

133+阅读 · 2020年12月22日

【斯坦福新书】决策算法，464页pdf，Algorithms for Decision Making

【斯坦福新书】决策算法，464页pdf，Algorithms for Decision Making

专知会员服务

124+阅读 · 2020年12月7日

【干货书】机器学习速查手册，135页pdf

【干货书】机器学习速查手册，135页pdf

专知会员服务

127+阅读 · 2020年11月20日

【2020新书】概率机器学习，附212页pdf与slides

【2020新书】概率机器学习，附212页pdf与slides

专知会员服务

111+阅读 · 2020年11月12日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知会员服务

277+阅读 · 2020年7月2日

【经典书】算法设计与分析，727页pdf，Algorithms Design and Analysis，牛津大学出版社

【经典书】算法设计与分析，727页pdf，Algorithms Design and Analysis，牛津大学出版社

专知会员服务

134+阅读 · 2020年2月25日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

经典书《斯坦福大学-多智能体系统》532页pdf

经典书《斯坦福大学-多智能体系统》532页pdf

专知

119+阅读 · 2020年1月29日

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

专知

46+阅读 · 2020年1月21日

斯坦福开放新书《应用线性代数导论：向量、矩阵和最小二乘法》473页pdf，带你入门线代

斯坦福开放新书《应用线性代数导论：向量、矩阵和最小二乘法》473页pdf，带你入门线代

专知

37+阅读 · 2019年11月30日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

经典书《机器学习：概率视角》第二版Python代码，附1098页pdf下载

经典书《机器学习：概率视角》第二版Python代码，附1098页pdf下载

专知

181+阅读 · 2019年10月23日

这本417页的数学基础，还没出版就能免费下载啦！

这本417页的数学基础，还没出版就能免费下载啦！

程序猿

91+阅读 · 2019年9月25日

《AutoML：方法，系统，挑战》新书免费下载

《AutoML：方法，系统，挑战》新书免费下载

新智元

24+阅读 · 2019年5月28日

421页《机器学习数学基础》最新2019版PDF下载

421页《机器学习数学基础》最新2019版PDF下载

专知

177+阅读 · 2019年3月17日

Efficient Formulation of Collision Avoidance Constraints in Optimization Based Trajectory Planning and Control

Efficient Formulation of Collision Avoidance Constraints in Optimization Based Trajectory Planning and Control

Arxiv

0+阅读 · 2021年4月26日

Learning Infinite-horizon Average-reward MDPs with Linear Function Approximation

Arxiv

0+阅读 · 2021年4月26日

Unifying Online and Counterfactual Learning to Rank

Arxiv

6+阅读 · 2020年12月8日

Meta-Learning with Implicit Gradients

Meta-Learning with Implicit Gradients

Arxiv

13+阅读 · 2019年9月10日

Generalization and Regularization in DQN

Generalization and Regularization in DQN

Arxiv

6+阅读 · 2019年1月30日

Variational Bayesian Reinforcement Learning with Regret Bounds

Arxiv

3+阅读 · 2018年7月25日

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

Arxiv

11+阅读 · 2018年7月12日

Mean Field Multi-Agent Reinforcement Learning

Arxiv

5+阅读 · 2018年6月12日

IQA: Visual Question Answering in Interactive Environments

Arxiv

5+阅读 · 2018年4月5日

Variance-based regularization with convex objectives

Arxiv

5+阅读 · 2017年12月14日

VIP会员

相关主题

不确定性决策

相关VIP内容

【斯坦福经典书】强化学习在金融应用，414页pdf

【斯坦福经典书】强化学习在金融应用，414页pdf

专知会员服务

127+阅读 · 2021年3月30日

【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策

【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策

专知会员服务

261+阅读 · 2021年1月27日

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

专知会员服务

76+阅读 · 2021年1月23日

【斯坦福】分布式算法与优化，118页pdf

专知会员服务

82+阅读 · 2020年12月22日

【斯坦福干货书】强化学习基金融领域应用，312页pdf

【斯坦福干货书】强化学习基金融领域应用，312页pdf

专知会员服务

133+阅读 · 2020年12月22日

【斯坦福新书】决策算法，464页pdf，Algorithms for Decision Making

【斯坦福新书】决策算法，464页pdf，Algorithms for Decision Making

专知会员服务

124+阅读 · 2020年12月7日

【干货书】机器学习速查手册，135页pdf

【干货书】机器学习速查手册，135页pdf

专知会员服务

127+阅读 · 2020年11月20日

【2020新书】概率机器学习，附212页pdf与slides

【2020新书】概率机器学习，附212页pdf与slides

专知会员服务

111+阅读 · 2020年11月12日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知会员服务

277+阅读 · 2020年7月2日

【经典书】算法设计与分析，727页pdf，Algorithms Design and Analysis，牛津大学出版社

【经典书】算法设计与分析，727页pdf，Algorithms Design and Analysis，牛津大学出版社

专知会员服务

134+阅读 · 2020年2月25日

热门VIP内容

开通专知VIP会员享更多权益服务

《美陆军特种作战条令》最新102页

《洛克希德SR-71“黑鸟”侦察机动力系统》21页slides

美空军作战实验室通过人工智能和指挥控制技术创新推进杀伤链

《指挥控制能力分析方法论》最新报告

相关资讯

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

经典书《斯坦福大学-多智能体系统》532页pdf

经典书《斯坦福大学-多智能体系统》532页pdf

专知

119+阅读 · 2020年1月29日

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

专知

46+阅读 · 2020年1月21日

斯坦福开放新书《应用线性代数导论：向量、矩阵和最小二乘法》473页pdf，带你入门线代

斯坦福开放新书《应用线性代数导论：向量、矩阵和最小二乘法》473页pdf，带你入门线代

专知

37+阅读 · 2019年11月30日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

经典书《机器学习：概率视角》第二版Python代码，附1098页pdf下载

经典书《机器学习：概率视角》第二版Python代码，附1098页pdf下载

专知

181+阅读 · 2019年10月23日

这本417页的数学基础，还没出版就能免费下载啦！

这本417页的数学基础，还没出版就能免费下载啦！

程序猿

91+阅读 · 2019年9月25日

《AutoML：方法，系统，挑战》新书免费下载

《AutoML：方法，系统，挑战》新书免费下载

新智元

24+阅读 · 2019年5月28日

421页《机器学习数学基础》最新2019版PDF下载

421页《机器学习数学基础》最新2019版PDF下载

专知

177+阅读 · 2019年3月17日

相关论文

Efficient Formulation of Collision Avoidance Constraints in Optimization Based Trajectory Planning and Control

Efficient Formulation of Collision Avoidance Constraints in Optimization Based Trajectory Planning and Control

Arxiv

0+阅读 · 2021年4月26日

Learning Infinite-horizon Average-reward MDPs with Linear Function Approximation

Arxiv

0+阅读 · 2021年4月26日

Unifying Online and Counterfactual Learning to Rank

Arxiv

6+阅读 · 2020年12月8日

Meta-Learning with Implicit Gradients

Meta-Learning with Implicit Gradients

Arxiv

13+阅读 · 2019年9月10日

Generalization and Regularization in DQN

Generalization and Regularization in DQN

Arxiv

6+阅读 · 2019年1月30日

Variational Bayesian Reinforcement Learning with Regret Bounds

Arxiv

3+阅读 · 2018年7月25日

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

Arxiv

11+阅读 · 2018年7月12日

Mean Field Multi-Agent Reinforcement Learning

Arxiv

5+阅读 · 2018年6月12日

IQA: Visual Question Answering in Interactive Environments

Arxiv

5+阅读 · 2018年4月5日

Variance-based regularization with convex objectives

Arxiv

5+阅读 · 2017年12月14日

大家都在搜

生成式人工智能

斯坦福博士论文

软件无线电

国防科技创新

久别重逢话双塔

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员