这本书提供了一个广泛的不确定性决策的算法介绍。我们涵盖了与决策相关的各种主题,介绍了潜在的数学问题公式和解决它们的算法。

本文面向高级本科生、研究生和专业人员。本书要求具有一定的数学基础,并假定预先接触过多变量微积分、线性代数和概率概念。附录中提供了一些复习材料。这本书特别有用的学科包括数学、统计学、计算机科学、航空航天、电气工程和运筹学。

这本教科书的基础是算法,它们都是用Julia编程语言实现的。这本允许免费使用与本书相关的代码片段,条件是必须确认代码的来源。我们预计其他人可能想把这些算法翻译成其他编程语言。随着翻译版本的发布,我们将从该书的网页上链接到它们。

许多重要的问题都涉及不确定性下的决策,包括飞机碰撞避免、灾害管理和灾难反应。在设计自动化决策系统或决策支持系统时,在做出或推荐决策时考虑各种不确定性来源是很重要的。考虑到这些不确定性的来源并仔细平衡系统的多个目标是非常具有挑战性的。我们将从计算的角度讨论这些挑战,旨在提供决策模型和计算方法背后的理论。本章介绍了不确定性下的决策问题,提供了一些应用实例,并概述了可能的计算方法的空间。本章总结了各种学科对我们理解智能决策的贡献,并强调了潜在社会影响的领域。我们以本书其余部分的大纲结束。

https://algorithmsbook.com/

Introduction

  • PART I: PROBABILISTIC REASONING Representation
  • PART II: SEQUENTIAL PROBLEMS Exact Solution Methods
  • PART III: MODEL UNCERTAINTY Exploration and Exploitation
  • PART V: MULTIAGENT SYSTEMS Multiagent Reasoning
成为VIP会员查看完整内容
0
86

相关内容

线性代数是计算和数据科学家的基本工具之一。这本书“高级线性代数:基础到前沿”(ALAFF)是一个替代传统高级线性代数的计算研究生课程。重点是数值线性代数,研究理论、算法和计算机算法如何相互作用。这些材料通过将文本、视频、练习和编程交织在一起来保持学习者的参与性。

我们在不同的设置中使用了这些材料。这是我们在德克萨斯大学奥斯汀分校名为“数值分析:线性代数”的课程的主要资源,该课程由计算机科学、数学、统计和数据科学、机械工程以及计算科学、工程和数学研究生课程提供。这门课程也通过UT-Austin计算机科学硕士在线课程提供“高级线性代数计算”。最后,它是edX平台上名为“高级线性代数:基础到前沿”的大规模在线开放课程(MOOC)的基础。我们希望其他人可以将ALAFF材料重新用于其他学习设置,无论是整体还是部分。

为了退怕学习者,我们采取了传统的主题的数字线性代数课程,并组织成三部分。正交性,求解线性系统,以及代数特征值问题。

  • 第一部分:正交性探讨了正交性(包括规范的处理、正交空间、奇异值分解(SVD)和解决线性最小二乘问题)。我们从这些主题开始,因为它们是其他课程的先决知识,学生们经常与高等线性代数并行(甚至在此之前)进行学习。

  • 第二部分:求解线性系统集中在所谓的直接和迭代方法,同时也引入了数值稳定性的概念,它量化和限定了在问题的原始陈述中引入的误差和/或在计算机算法中发生的舍入如何影响计算的正确性。

  • 第三部分:代数特征值问题,重点是计算矩阵的特征值和特征向量的理论和实践。这和对角化矩阵是密切相关的。推广了求解特征值问题的实用算法,使其可以用于奇异值分解的计算。本部分和本课程以在现代计算机上执行矩阵计算时如何实现高性能的讨论结束。

成为VIP会员查看完整内容
0
89

第一节课的重点是分析今天能够进行并行计算的典型个人计算机中的算法行为,第二节课的重点是今天能够进行分布式计算的典型公共云中的此类个人计算机集群中的算法行为。我们将从第1节中简要介绍的基本原理开始,并努力理解过去几十年来算法的重大突破。并行计算是指在一台机器上使用多个处理器和共享内存进行计算。并行计算和分布式计算虽然密切相关,但它们都提出了独特的挑战——主要是并行计算情况下的共享内存管理和分布式计算情况下的网络通信开销最小化。理解并行计算的模型和挑战是理解分布式计算的基础。课程内容反映了这一点,首先在并行环境中涵盖各种经典的、数值的和图形的算法,然后在分布式环境中涵盖相同的主题。目的是强调每个设置带来的独特挑战。

https://github.com/lamastex/scalable-data-science/blob/master/read/daosu.pdf

成为VIP会员查看完整内容
0
47

强化学习(RL)作为一种可行且强大的技术,正逐渐成为一种解决各种复杂业务问题的技术,这些问题涉及不确定条件下的连续优化决策。尽管RL被归类为机器学习(ML)的一个分支,但它往往与ML(监督学习和非监督学习)的其他分支有很大的不同。事实上,RL似乎掌握着开启人工智能前景的钥匙——机器可以根据观察到的异常信息调整决策,同时不断转向最佳结果。它在无人驾驶汽车、机器人和策略游戏等备受关注的问题上的应用,预示着未来RL算法将拥有远超人类的决策能力。但是当谈到RL的学习应用时,人们似乎不愿意直接进入。我们经常听到甚至技术人员声称RL涉及“高等数学”和“复杂工程”,所以似乎有一个心理障碍进入。虽然现实世界的RL算法和实现在克服众所周知的最后业务问题时确实变得相当复杂,但是RL的基础实际上不需要繁重的技术机器就可以学会。本书的核心目的是通过在理解的深度和保持基本技术内容之间找到平衡来揭开RL的神秘面纱。因此,我们将学习:

  • 您将了解简单而强大的马尔可夫决策过程(MDPs)理论——不确定情况下的序列最优决策框架。您将坚定地理解Bellman方程的力量,它是所有动态规划和所有RL算法的核心。

  • 您将掌握动态规划(DP)算法,这是一类(用人工智能的语言)规划算法。您将学习策略迭代、值迭代、逆向归纳、近似动态规划和广义策略迭代的重要概念,它是所有DP和所有RL算法的核心。

  • 您将获得各种强化学习(RL)算法的坚实的理解,从基本算法如SARSA和Q-Learning,并进入学习在实践中工作得很好的几个重要的算法,包括梯度时间差分,深度Q网络,最小二乘策略迭代,策略梯度,蒙特卡罗树搜索。您将了解如何利用bootstrapping、off-policy学习和基于深度神经网络的函数逼近在这些算法中获得优势。您还将学习如何平衡探索和利用Multi-Armed Bandits技术,如置信上限,汤普森采样,梯度盗匪和信息状态空间算法。

  • 您将练习大量的模型和算法的“从头开始”Python实现。贯穿全书,我们强调了良好的Python编程实践,包括接口设计、类型注释、函数式编程和基于继承的多态(始终确保编程原则反映数学原则)。从这本书中获得的更大的收获是一种将应用数学概念与软件设计范例相结合的罕见的(高需求的)能力。

成为VIP会员查看完整内容
0
65

许多重要的问题都涉及不确定性下的决策,包括飞机碰撞避免、灾害管理和灾难反应。在设计自动化决策系统或决策支持系统时,在做出或推荐决策时考虑各种不确定性来源是很重要的。考虑到这些不确定性的来源并仔细平衡系统的多个目标是非常具有挑战性的。我们将从计算的角度讨论这些挑战,旨在提供决策模型和计算方法背后的理论。本章介绍了不确定性下的决策问题,提供了一些应用实例,并概述了可能的计算方法的空间。本章总结了各种学科对我们理解智能决策的贡献,并强调了潜在社会影响的领域。我们以本书其余部分的大纲结束。

https://github.com/sisl/algorithmsbook

成为VIP会员查看完整内容
0
58

有很多关于傅里叶变换的书; 然而,很少有面向多学科读者的。为工程师写一本关于代数概念的书是一个真正的挑战,即使不是太难的事,也要比写一本关于理论应用的代数书更有挑战性。这就是本书试图面对的挑战。因此,每个读者都能够创建一个“按菜单”的程序,并从语句或计算机程序中提取特定元素,以建立他们在该领域的知识,或将其运用于更具体的问题。

本文叙述是非常详细的。读者可能偶尔需要一些关于有限组的高级概念,以及对组行为的熟悉程度。我强调了那些重要的定义和符号。例如,从多个角度(交换群、信号处理、非交换群)研究卷积的概念,每次都要放在它的背景知识中。因此,不同的段落,虽然遵循一个逻辑递进,有一个真正的统一,但可以根据自己需要选取阅读。

第一章用群论的语言来解释主要概念,并解释后面将用到的符号。第二章将所得结果应用于各种问题,并首次接触快速算法(例如Walsh 变换)。第三章对离散傅里叶变换进行了阐述。第四章介绍了离散傅里叶变换的各种应用,并构成了对前一章的必要补充,以充分理解所涉及的机制以及在实际情况中使用。第五章围绕傅里叶变换提出了更多新颖的思想和算法,产生了大量的应用。第六章需要一些更高级的知识,特别是对有限场理论的一些熟悉。它研究了有限域中的值变换,并给出了在校正码中的应用。最后两章(最困难的一章),具有更多的代数性质,并建议推广已经在有限非交换群的情况下进行的构造。第七章揭示了线性表示的理论。第八章和最后一章将这一理论应用于理论(群的简洁性研究)和实际(光谱分析)领域。

https://mathematical-tours.github.io/daft/

成为VIP会员查看完整内容
0
46

这本书全面介绍优化工程系统设计的实用算法。这本书从工程的角度进行优化,其目标是设计一个系统来优化受约束的一组指标。读者将学习一系列挑战的计算方法,包括高维搜索空间,处理有多个竞争目标的问题,以及适应指标中的不确定性。图表、例子和练习传达了数学方法背后的直觉。文本提供了Julia编程语言的具体实现。

https://mitpress.mit.edu/books/algorithms-optimization

许多学科的核心都涉及到优化。在物理学中,系统被驱动到他们的最低能量状态服从物理定律。在商业上,公司的目标是股东价值最大化。在生物学中,越健康的生物体越有可能生存下来。这本书将从工程的角度关注优化,目标是设计一个系统来优化受约束的一组指标。这个系统可以是一个复杂的物理系统,比如飞机,也可以是一个简单的结构,比如自行车车架。这个系统甚至可能不是物理的;例如,我们可能会有兴趣为自动化车辆设计一个控制系统,或设计一个计算机视觉系统来检测肿瘤活检的图像是否为癌。我们希望这些系统能运行得尽可能好。根据应用程序的不同,相关的度量可能包括效率、安全性和准确性。对设计的限制可能包括成本、重量和结构坚固性。

这本书是关于优化的算法,或计算过程。给定系统设计的一些表示,如编码机翼几何的一组数字,这些算法将告诉我们如何搜索空间的可能设计,以找到最好的一个。根据应用程序的不同,这种搜索可能涉及运行物理实验,比如风洞测试,也可能涉及计算解析表达式或运行计算机模拟。我们将讨论解决各种挑战的计算方法,例如如何搜索高维空间,处理有多个竞争目标的问题,以及适应指标中的不确定性。

成为VIP会员查看完整内容
0
152

决策理论是现代人工智能和经济学的基础。本课程主要从统计学的角度,也从哲学的角度,为决策理论打下坚实的基础。本课程有两个目的:

  • 深入了解统计决策理论、实验设计的自动化方法,并将其与人类决策联系起来。
  • 通过开发算法和智能代理的实验,将该理论应用到强化学习和人工智能的实际问题中。

课程可分为两部分。

  • 第一部分,我们介绍了主观概率和效用的概念,以及如何用它们来表示和解决决策问题。然后讨论未知参数的估计和假设检验。最后,我们讨论了顺序抽样、顺序实验,以及更一般的顺序决策。

  • 第二部分是不确定性下的决策研究,特别是强化学习和专家咨询学习。首先,我们研究几个有代表性的统计模型。然后,我们给出了使用这些模型做出最优决策的算法的概述。最后,我们来看看学习如何根据专家的建议来行动的问题,这个领域最近在在线广告、游戏树搜索和优化方面有很多应用。

成为VIP会员查看完整内容
0
97

《算法:设计与分析》是为计算机科学、工程、信息技术和计算机应用专业的本科生和研究生设计的教材。本书提供了理论和数学并俱的概念。它涵盖了算法的基础、设计技术、高级主题和应用。本书也将作为研究人员和打算追求算法设计的专业程序员一个有用的参考。本书还为准备校园面试和竞争性考试的学生提供了参考。

  • 提供深入的主题处理,如复杂性分析、设计范例、数据结构和机器学习算法
  • 介绍 Decrease and Conquer, Transform and Conquer 和 PSpace 以及标准范例等主题
  • 解释包括欧几里德定理和中国剩余定理在内的数值方法,并回顾基本的数学概念
  • 在每章的结尾提供要点和关键术语列表,帮助读者快速回忆重要的概念
  • 在每一章结尾和附录10中给出的练习将帮助学生为考试和面试做准备

Harsh Bhasin, Assistant Professor, FMIT, Jamia Hamdard, New Delhi

成为VIP会员查看完整内容
0
90

斯坦福大学Stephen Boyd教授与加州大学Lieven Vandenberghe教授合著的应用线性代数导论:向量、矩阵和最小二乘法《Introduction to Applied Linear Algebra – Vectors, Matrices, and Least Squares》在2018年由剑桥大学出版社发行,开源书包含19章,473页pdf,这本书的目的是提供一个介绍向量,矩阵,最小二乘方法,应用线性代数的基本主题。目标是让学生通俗易懂,入门学习。让学习者了解在包括数据拟合、机器学习和人工智能,断层、导航、图像处理、金融、和自动控制系统的应用。是一本不可多得好教材。​

Stephen P. Boyd是斯坦福大学电子工程Samsung 教授,信息系统实验室电子工程教授,斯坦福大学电子工程系系主任。他在管理科学与工程系和计算机科学系任职,是计算与数学工程研究所的成员。他目前的研究重点是凸优化在控制、信号处理、机器学习和金融方面的应用。 https://web.stanford.edu/~boyd/

Lieven Vandenberghe,美国加州大学洛杉矶分校电子与计算机工程系和数学系教授

这本书的目的是提供一个介绍向量,矩阵,最小二乘方法,应用线性代数的基本主题。我们的目标是让很少或根本没有接触过线性代数的学生快速学习,以及对如何使用它们在许多应用程序中, 包括数据拟合、机器学习和人工智能, 断层、导航、图像处理、金融、和自动控制系统。

读者所需要的背景知识是熟悉基本的数学符号。我们只在少数地方使用微积分,但它并不是一个关键的角色,也不是一个严格的先决条件。虽然这本书涵盖了许多传统上作为概率和统计的一部分来教授的话题,比如如何将数学模型与数据相匹配,但它并不需要概率和统计方面的知识或背景。

这本书涉及的数学比应用线性代数的典型文本还少。我们只使用线性代数中的一个理论概念,线性无关,和一个计算工具,QR分解;我们处理大多数应用程序的方法只依赖于一种方法,即最小二乘(或某种扩展)。从这个意义上说,我们的目标是知识经济:仅用一些基本的数学思想、概念和方法,我们就涵盖了许多应用。然而,我们所提供的数学是完整的,因为我们仔细地证明了每一个数学命题。然而,与大多数介绍性的线性代数文本不同,我们描述了许多应用程序,包括一些通常被认为是高级主题的应用程序,如文档分类、控制、状态估计和组合优化。

这本书分为三部分。第一部分向读者介绍向量,以及各种向量运算和函数,如加法、内积、距离和角度。我们还将描述如何在应用程序中使用向量来表示文档中的字数、时间序列、病人的属性、产品的销售、音轨、图像或投资组合。第二部分对矩阵也做了同样的处理,最终以矩阵的逆和求解线性方程的方法结束。第三部分,关于最小二乘,是回报,至少在应用方面。我们展示了近似求解一组超定方程的简单而自然的思想,以及对这一基本思想的一些扩展,可以用来解决许多实际问题。

成为VIP会员查看完整内容
0
156
小贴士
相关论文
Keaven M. Anderson,Zifang Guo,Jing Zhao,Linda Z. Sun
0+阅读 · 3月18日
Kumar Nitesh,Kuzelka Ondrej,De Raedt Luc
0+阅读 · 3月18日
Conor F. Hayes,Roxana Rădulescu,Eugenio Bargiacchi,Johan Källström,Matthew Macfarlane,Mathieu Reymond,Timothy Verstraeten,Luisa M. Zintgraf,Richard Dazeley,Fredrik Heintz,Enda Howley,Athirai A. Irissappane,Patrick Mannion,Ann Nowé,Gabriel Ramos,Marcello Restelli,Peter Vamplew,Diederik M. Roijers
0+阅读 · 3月17日
Jindong Wang,Cuiling Lan,Chang Liu,Yidong Ouyang,Tao Qin
15+阅读 · 3月10日
Jianzhu Guo,Xiangyu Zhu,Chenxu Zhao,Dong Cao,Zhen Lei,Stan Z. Li
4+阅读 · 2020年3月17日
Hyper-Parameter Optimization: A Review of Algorithms and Applications
Tong Yu,Hong Zhu
12+阅读 · 2020年3月12日
Fang Liu,Guoming Tang,Youhuizi Li,Zhiping Cai,Xingzhou Zhang,Tongqing Zhou
15+阅读 · 2019年11月7日
Meta-Learning to Cluster
Yibo Jiang,Nakul Verma
12+阅读 · 2019年10月30日
Shaohui Liu,Yi Wei,Jiwen Lu,Jie Zhou
3+阅读 · 2018年3月27日
YaoSheng Yang,Meishan Zhang,Wenliang Chen,Wei Zhang,Haofen Wang,Min Zhang
12+阅读 · 2018年1月16日
Top