为土木工程专业的学生和专业人士介绍概率机器学习的关键概念和技术;有许多循序渐进的例子、插图和练习。

这本书向土木工程的学生和专业人员介绍了概率机器学习的概念,以一种对没有统计学或计算机科学专业背景的读者可访问的方式提出了关键的方法和技术。通过一步步的例子、插图和练习,它清晰而直接地展示了不同的方法。掌握了材料,读者将能够理解更高级的机器学习文献,从这本书中提取。

本书介绍了概率机器学习的三个子领域的关键方法:监督学习、非监督学习和强化学习。它首先涵盖了理解机器学习所需的背景知识,包括线性代数和概率论。接着介绍了有监督和无监督学习方法背后的贝叶斯估计,以及马尔可夫链蒙特卡洛方法,该方法使贝叶斯估计能够在某些复杂情况下进行。这本书接着涵盖了与监督学习相关的方法,包括回归方法和分类方法,以及与非监督学习相关的概念,包括聚类、降维、贝叶斯网络、状态空间模型和模型校准。最后,本书介绍了不确定环境下理性决策的基本概念,以及不确定和序列上下文下理性决策的基本概念。在此基础上,这本书描述了强化学习的基础,虚拟代理学习如何通过试验和错误作出最优决策,而与它的环境交互。

目录内容: Chapter 1: 引言 Introduction Part one: 背景 Background
Chapter 2: 线性代数 Chapter 3: 概率理论 Probability Theory Chapter 4: 概率分布 Probability Distributions Chapter 5: 凸优化 Convex Optimization Part two: 贝叶斯估计 Bayesian Estimation Chapter 6: 从数据中学习 Learning from Data Chapter 7: 马尔科夫链蒙特卡洛 Markov Chain Monte Carlo
Part three: 监督学习 Supervised Learning Chapter 8: 回归 Regression Chapter 9: 分类 Classification Part four: 无监督学习 Unsupervised Learning Chapter 10: 聚类 Clustering Chapter 11: 贝叶斯网络 Bayesian Networks Chapter 12: 状态空间 State-Space Models Chapter 13: 模型 Model Calibration Part five: 强化学习 Reinforcement Learning Chapter 14: 不确定上下文决策 Decision in Uncertain Contexts Chapter 15: 序列决策 Sequential Decisions

成为VIP会员查看完整内容
0
53

相关内容

本话题关于日常用语「概率」,用于讨论生活中的运气、机会,及赌博、彩票、游戏中的「技巧」。关于抽象数学概念「概率」的讨论,请转 概率(数学)话题。

这本书介绍了金融中的机器学习方法。它为量化金融提出了一个统一的处理机器学习和各种统计计算学科,如金融计量经济学和离散时间随机控制,并强调为金融数据建模和决策如何进行理论和假设检验做出算法的选择。随着计算资源和数据集的增加,机器学习已经成为金融业的一项重要技能。这本书是为在金融计量经济学,金融数学和应用统计学的高级研究生和学者写的,此外还包括在定量金融领域的定量和数据科学家。

金融中的机器学习:从理论到实践分为三个部分,每个部分包括理论和应用。第一篇从贝叶斯和频率论的角度介绍了对横断面数据的监督学习。更高级的材料强调神经网络,包括深度学习,以及高斯过程,在投资管理和衍生建模的例子。第二部分介绍了时间序列数据的监督学习,这是金融领域最常用的数据类型,并举例说明了交易、随机波动和固定收益模型。最后,第三部分介绍了强化学习及其在交易、投资和财富管理中的应用。还提供了Python代码示例,以支持读者对方法和应用的理解。这本书还包括超过80个数学和编程练习例子,与工作的解决方案可提供给教师。作为这一新兴领域研究的桥梁,最后一章从研究人员的角度介绍了金融机器学习的前沿,强调了统计物理中有多少众所周知的概念可能会作为金融机器学习的重要方法出现。

https://www.springer.com/gp/book/9783030410674

代码: https://github.com/mfrdixon/ML_Finance_Codes

成为VIP会员查看完整内容
2
119

这本书系统性讲述了统计学理论,包括概率理论、分布式理论与统计模型,基本统计理论、贝叶斯理论、无偏点估计、最大似然统计推断、统计假设与置信集、非参与鲁棒推断。

第一门课程以对统计中有用的测量论概率论的概念和结果的简要概述开始。随后讨论了统计决策理论和推理中的一些基本概念。探讨了估计的基本方法和原理,包括各种限制条件下的最小风险方法,如无偏性或等方差法,最大似然法,以及矩法和其他插件方法等函数法。然后详细地考虑了贝叶斯决策规则。详细介绍了最小方差无偏估计的方法。主题包括统计量的充分性和完全性、 Fisher信息、估计量的方差的界、渐近性质和统计决策理论,包括极大极小和贝叶斯决策规则。

第二门课程更详细地介绍了假设检验和置信集的原理。我们考虑了决策过程的表征,内曼-皮尔森引理和一致最有力的测试,置信集和推理过程的无偏性。其他主题包括等方差、健壮性和函数估计。

除了数理统计的经典结果外,还讨论了马尔可夫链蒙特卡洛理论、拟似然、经验似然、统计泛函、广义估计方程、折刀法和自举法。

http://mason.gmu.edu/~jgentle/books/MathStat.pdf

成为VIP会员查看完整内容
0
56

这份手册最大的特点就是包含许多关于机器学习的经典公式和图表,有助于您快速回忆有关机器学习的知识点。非常适合那些正在准备与机器学习相关的工作面试的人。

项目地址: https://github.com/soulmachine/machine-learning-cheat-sheet

该手册虽然只有 135 页,但麻雀虽小五脏俱全,包含了 28 个主题内容,目录如下:

  • Introduction
  • Probability
  • Generative models for discrete data
  • Gaussian Models
  • Bayesian statistics
  • Frequentist statistics
  • Linear Regression
  • Logistic Regression
  • Generalized linear models and the exponential family
  • Directed graphical models(Bayes nets)
  • Mixture models and the EM algorithm
  • Latent linear models
  • Sparse linear models
  • Kernels
  • Gaussian processes
  • Adaptive basis function models
  • Hidden markov Model
  • State space models
  • Undirected graphical models(Markov random fields)
  • Exact inference for graphical models
  • Variational inference
  • More variational inference
  • Monte Carlo inference
  • Markov chain Monte Carlo (MCMC)inference
  • Clustering
  • Graphical model structure learning
  • Latent variable models for discrete data
  • Deep learning
成为VIP会员查看完整内容
0
52

《数据科学与机器学习概论》的创建目标是为寻求了解数据科学的初学者、数据爱好者和经验丰富的数据专业人士提供从头到尾对使用开源编程进行数据科学应用开发的深刻理解。这本书分为四个部分: 第一部分包含对这本书的介绍,第二部分涵盖了数据科学、软件开发和基于开源嵌入式硬件的领域; 第三部分包括算法,是数据科学应用的决策引擎; 最后一节汇集了前三节中共享的概念,并提供了几个数据科学应用程序示例。

^

  1. Introductory Chapter: Clustering with Nature-Inspired Optimization Algorithms 在本章中,读者将学习如何为聚类问题应用优化算法。

By Pakize Erdogmus and Fatih Kayaalp

  1. Best Practices in Accelerating the Data Science Process in Python

By Deanne Larson

数据科学和大数据项目的数量正在增长,当前的软件开发方法受到了挑战,以支持和促进这些项目的成功和频率。关于如何使用数据科学算法以及大数据的好处已经有了很多研究,但是关于可以利用哪些最佳实践来加速和有效地交付数据科学和大数据项目的研究却很少。大数据的数量、种类、速度和准确性等特点使这些项目复杂化。数据科学家可利用的开源技术的激增也会使情况变得复杂。随着数据科学和大数据项目的增加,组织正在努力成功交付。本文讨论了数据科学和大数据项目过程,过程中的差距,最佳实践,以及这些最佳实践如何在Python中应用,Python是一种常见的数据科学开源编程语言。

  1. Software Design for Success By Laura M. Castro

正如人们所期望的那样,技术书籍的大部分时间都集中在技术方面。然而,这造成了一种错觉,即技术在某种程度上是没有偏见的,总是中性的,因此适合每个人。后来,当产品已经存在时,现实会证明我们不是这样的。包含和表示在设计和建模阶段是至关重要的。在本章中,我们将从架构的角度分析,哪些非功能性需求是最敏感的,以及如何开始讨论它们以最大限度地提高我们的软件产品成功的可能性。

  1. Embedded Systems Based on Open Source Platforms By Zlatko Bundalo and Dusanka Bundalo

  2. The K-Means Algorithm Evolution By Joaquín Pérez-Ortega, Nelva Nely Almanza-Ortega, Andrea Vega-Villalobos, Rodolfo Pazos-Rangel, Crispín Zavala-Díaz and Alicia Martínez-Rebollar

  3. “Set of Strings” Framework for Big Data Modeling By Igor Sheremet

  4. Investigation of Fuzzy Inductive Modeling Method in Forecasting Problems By Yu. Zaychenko and Helen Zaychenko

  5. Segmenting Images Using Hybridization of K-Means and Fuzzy C-Means Algorithms By Raja Kishor Duggirala

  6. The Software to the Soft Target Assessment By Lucia Mrazkova Duricova, Martin Hromada and Jan Mrazek

  7. The Methodological Standard to the Assessment of the Traffic Simulation in Real Time By Jan Mrazek, Martin Hromada and Lucia Duricova Mrazkova

  8. Augmented Post Systems: Syntax, Semantics, and Applications By Igor Sheremet

  9. Serialization in Object-Oriented Programming Languages By Konrad Grochowski, Michał Breiter and Robert Nowak

本章描述了将对象状态转换为一种格式的过程,这种格式可以在当前使用的面向对象编程语言中传输或存储。这个过程称为序列化(封送处理);相反的称为反序列化(反编组)进程。它是一种低级技术,应该考虑一些技术问题,如内存表示的大小、数字表示、对象引用、递归对象连接等。在本章中,我们将讨论这些问题并给出解决办法。我们还简要回顾了当前使用的工具,并指出满足所有需求是不可能的。最后,我们提供了一个新的支持向前兼容性的c++库。

成为VIP会员查看完整内容
0
45

近日,本科毕业于哈佛大学统计学与经济学专业、现任哈佛助教的 Daniel Friedman 开放了他撰写的一本免费在线书籍《Machine Learning from Scratch》,该书从理论和数学上介绍了 ML 最常见算法(OLS、逻辑回归、朴素贝叶斯、决策树、boosts 和神经网络等)的完整推论。

地址:https://dafriedman97.github.io/mlbook/content/introduction.html

该书是为读者学习新的机器学习算法或了解更深层次的算法。具体地说,它是为那些有兴趣学习机器学习算法的读者准备的。这些推导可能有助于读者,特别是对基础算法不熟悉的读者,可以更直观地理解它们是如何工作的。或者,这些推导可以帮助有建模经验的读者理解不同算法是如何创建模型,以及每种算法的优缺点。

书籍概述

这本书涵盖了机器学习中最常见的方法。这些方法就像一个工具箱,为那些进入机器学习领域的人提供了便利,从而可以很快地找到所需工具。该书由 7 个章节以及 1 个附录组成。书的每一章节都对应一种机器学习方法或一组方法。

通过学习,你将学得:普通线性回归、线性回归扩展、判别分类器(Logistic 回归)、生成分类器(朴素贝叶斯)以及决策树等算法的完整推论。

每个章节均由这 3 部分组成。

其中,概念部分从概念上介绍这些方法,并从数学上推导结果;构建部分展示了如何使用 Python 从头开始构建方法;实现部分介绍了如何使用 Python 中的工具包(如 scikit-learn、statsmodels 和 tensorflow)应用这些方法。

为什么选择这本书?

现在关于机器学习的书籍数不胜数,在网上就可以免费获得。像《An Introduction to Statistical Learning》、《Elements of Statistical Learning》 和 《Pattern Recognition and Machine Learning》,这些机器学习书籍的作者掌握的知识更丰富,书籍内容涵盖的范围也更广。但值得注意的一点是:这些书籍只提供了概念上的机器学习以及方法背后的理论。

但是,本书重点介绍了机器学习算法的基本框架,旨在为读者提供独立构建这些算法的能力。作为一种「工具箱」而言,本书旨在成为用户指南,它不是用来指导用户关于该领域的广泛实践,而是在微观层面上讲述如何使用每种工具。

这本书需要读者掌握哪些知识?

需要注意的是,这本书的「概念」部分需要读者了解微积分知识,有些还需要了解概率(如最大似然和贝叶斯规则)和基本线性代数知识(如矩阵运算和点积)。

不过,该书附录部分回顾了所需的数学和概率知识。「概念」部分还参考了一些常见的机器学习方法,这些方法在附录中也有介绍。所以,「概念」部分不需要任何编程知识。

该书的「构建」和「代码」部分使用了一些基础的 Python 知识。「构建」部分需要了解相应的内容,并且需要熟悉用 Python 创建函数和类。「代码」部分则不需要这些知识。

参考链接:

https://mp.weixin.qq.com/s/xrUw_4IPI4BhYwHvjSuwzA

成为VIP会员查看完整内容
0
84

强化学习是现在人工智能领域里面最活跃的研究领域之一,它是一种用于学习的计算方法,其中会有一个代理在与复杂的不确定环境交互时试图最大化其所收到的奖励。现在,如果你是一个强化学习的初学者,由 Richard Sutton 和 Andrew Barto 合著的《Reinforcement Learning : An Introduction》可能就是你的最佳选择。这本书提供了关于强化学习的简单明了的关键思想和算法的解释。他们讨论了该领域的知识基础的历史延伸到了最新的发展的应用。

本书全文共分三部分,17章内容

  • 第一部分:列表(Tabular)解决法,第一章描述了强化学习问题具体案例的解决方案,第二章描述了贯穿全书的一般问题制定——有限马尔科夫决策过程,其主要思想包括贝尔曼方程(Bellman equation)和价值函数,第三、四、五章介绍了解决有限马尔科夫决策问题的三类基本方法:动态编程,蒙特卡洛方法、时序差分学习。三者各有其优缺点,第六、七章介绍了上述三类方法如何结合在一起进而达到最佳效果。第六章中介绍了可使用适合度轨迹(eligibility traces)把蒙特卡洛方法和时序差分学习的优势整合起来。第七章中表明时序差分学习可与模型学习和规划方法(比如动态编程)结合起来,获得一个解决列表强化学习问题的完整而统一的方案。

  • 第二部分:近似求解法,从某种程度上讲只需要将强化学习方法和已有的泛化方法结合起来。泛化方法通常称为函数逼近,从理论上看,在这些领域中研究过的任何方法都可以用作强化学习算法中的函数逼近器,虽然实际上有些方法比起其它更加适用于强化学习。在强化学习中使用函数逼近涉及一些在传统的监督学习中不常出现的新问题,比如非稳定性(nonstationarity)、引导(bootstrapping)和目标延迟(delayed targets)。这部分的五章中先后介绍这些以及其它问题。首先集中讨论在线(on-policy)训练,而在第九章中的预测案例其策略是给定的,只有其价值函数是近似的,在第十章中的控制案例中最优策略的一个近似已经找到。第十一章讨论函数逼近的离线(off-policy)学习的困难。第十二章将介绍和分析适合度轨迹(eligibility traces)的算法机制,它能在多个案例中显著优化多步强化学习方法的计算特性。这一部分的最后一章将探索一种不同的控制、策略梯度的方法,它能直接逼近最优策略且完全不需要设定近似值函数(虽然如果使用了一个逼近价值函数,效率会高得多)。

  • 第三部分:深层次研究,这部分把眼光放到第一、二部分中介绍标准的强化学习思想之外,简单地概述它们和心理学以及神经科学的关系,讨论一个强化学习应用的采样过程,和一些未来的强化学习研究的活跃前沿。

成为VIP会员查看完整内容
0
95

贝叶斯网络(Bayesian networks,BN)最近在众多领域中引发了兴趣,参与了许多不同的应用,包括经济、风险分析、资产和负债管理、人工智能和机器人、交通系统规划和优化、政治学分析、法律和法医科学评估、药理学和药物基因组学、系统生物学和代谢组学、心理学和政策制定和社会方案评价等。这种强烈的响应可以看出,结构和过程的概率贝叶斯模型是可靠的和稳定的因果关系的表示。与传统的频率统计方法相比,BN通过合并新的数据而获得增量或纵向改进的能力提供了额外的优势。本书的参与者阐明了BN这些方面的各种新的进展。

下载地址:链接: https://pan.baidu.com/s/16ZKifEDhWp-vmy1R_6C02w 提取码: 7gnx

  • 第一章 Introductory Chapter: Timeliness of Advantages of Bayesian Networks By Douglas S. McNair
  • 第二章 An Economic Growth Model Using Hierarchical Bayesian Method By Nur Iriawan and Septia Devi Prihastuti Yasmirullah
  • 第三章 Bayesian Networks for Decision-Making and Causal Analysis under Uncertainty in Aviation
  • 第四章 Using Bayesian Networks for Risk Assessment in Healthcare System
  • 第五章 Continuous Learning of the Structure of Bayesian Networks: A Mapping Study
  • 第六章 Multimodal Bayesian Network for Artificial Perception
  • 第七章 Quantitative Structure-Activity Relationship Modeling and Bayesian Networks: Optimality of Naive Bayes Model
  • 第八章 Bayesian Graphical Model Application for Monetary Policy and Macroeconomic Performance in Nigeria
成为VIP会员查看完整内容
1
83

由Marc Peter Deisenroth,A Aldo Faisal和Cheng Soon Ong撰写的《机器学习数学基础》“Mathematics for Machine Learning” 最新版417页pdf版本已经放出,作者表示撰写这本书旨在激励人们学习数学概念。这本书并不打算涵盖前沿的机器学习技术,因为已经有很多书这样做了。相反,作者的目标是通过该书提供阅读其他书籍所需的数学基础。这本书分为两部分:数学基础知识和使用数学基础知识进行机器学习算法示例。值得初学者收藏和学习!

目录

Part I: 数据基础

  • Introduction and Motivation
  • Linear Algebra
  • Analytic Geometry
  • Matrix Decompositions
  • Vector Calculus
  • Probability and Distribution
  • Continuous Optimization

Part II: 机器学习问题

  • When Models Meet Data
  • Linear Regression
  • Dimensionality Reduction with Principal Component Analysis
  • Density Estimation with Gaussian Mixture Models
  • Classification with Support Vector Machines
成为VIP会员查看完整内容
0
122

The tutorial is written for those who would like an introduction to reinforcement learning (RL). The aim is to provide an intuitive presentation of the ideas rather than concentrate on the deeper mathematics underlying the topic. RL is generally used to solve the so-called Markov decision problem (MDP). In other words, the problem that you are attempting to solve with RL should be an MDP or its variant. The theory of RL relies on dynamic programming (DP) and artificial intelligence (AI). We will begin with a quick description of MDPs. We will discuss what we mean by “complex” and “large-scale” MDPs. Then we will explain why RL is needed to solve complex and large-scale MDPs. The semi-Markov decision problem (SMDP) will also be covered.

The tutorial is meant to serve as an introduction to these topics and is based mostly on the book: “Simulation-based optimization: Parametric Optimization techniques and reinforcement learning” [4]. The book discusses this topic in greater detail in the context of simulators. There are at least two other textbooks that I would recommend you to read: (i) Neuro-dynamic programming [2] (lots of details on convergence analysis) and (ii) Reinforcement Learning: An Introduction [11] (lots of details on underlying AI concepts). A more recent tutorial on this topic is [8]. This tutorial has 2 sections: • Section 2 discusses MDPs and SMDPs. • Section 3 discusses RL. By the end of this tutorial, you should be able to • Identify problem structures that can be set up as MDPs / SMDPs. • Use some RL algorithms.

成为VIP会员查看完整内容
0
58
小贴士
相关VIP内容
专知会员服务
56+阅读 · 2020年12月6日
专知会员服务
52+阅读 · 2020年11月20日
专知会员服务
45+阅读 · 2020年9月14日
【新书】贝叶斯网络进展与新应用,附全书下载
专知会员服务
83+阅读 · 2019年12月9日
强化学习最新教程,17页pdf
专知会员服务
58+阅读 · 2019年10月11日
MIT新书《强化学习与最优控制》
专知会员服务
128+阅读 · 2019年10月9日
相关资讯
相关论文
Andrea Cappozzo,Francesca Greselin,Thomas Brendan Murphy
0+阅读 · 2020年12月15日
Emmanuel Bengio,Joelle Pineau,Doina Precup
7+阅读 · 2020年3月13日
Talking-Heads Attention
Noam Shazeer,Zhenzhong Lan,Youlong Cheng,Nan Ding,Le Hou
12+阅读 · 2020年3月5日
Data Augmentation of Room Classifiers using Generative Adversarial Networks
Constantinos Papayiannis,Christine Evers,Patrick A. Naylor
4+阅读 · 2019年1月10日
Adversarial Transfer Learning
Garrett Wilson,Diane J. Cook
10+阅读 · 2018年12月6日
Contrastive Explanations for Reinforcement Learning in terms of Expected Consequences
Jasper van der Waa,Jurriaan van Diggelen,Karel van den Bosch,Mark Neerincx
4+阅读 · 2018年7月23日
Jianxin Lin,Yingce Xia,Tao Qin,Zhibo Chen,Tie-Yan Liu
5+阅读 · 2018年5月1日
Wenhao Jiang,Lin Ma,Xinpeng Chen,Hanwang Zhang,Wei Liu
6+阅读 · 2018年4月3日
Top