最新版《机器学习数学基础》发布,417页PDF免费下载

2019 年 9 月 5 日 新智元
最新版《机器学习数学基础》发布,417页PDF免费下载



  新智元推荐  

来源:专知(ID: Quan_Zhuanzhi)

【新智元导读】《机器学习数学基础》最新版 417 页 pdf 版本已经放出,本书旨在激励人们学习数学概念,包括数学基础知识和使用数学基础知识进行机器学习算法示例两部分,值得收藏学习!


由 Marc Peter Deisenroth,A Aldo Faisal 和 Cheng Soon Ong 撰写的《机器学习数学基础》“Mathematics for Machine Learning” 最新版 417 页 pdf 版本已经放出,作者表示撰写这本书旨在激励人们学习数学概念。


这本书并不打算涵盖前沿的机器学习技术,因为已经有很多书这样做了。相反,作者的目标是通过该书提供阅读其他书籍所需的数学基础。


这本书分为两部分:数学基础知识和使用数学基础知识进行机器学习算法示例。值得初学者收藏和学习!

 


前言(Foreword)


随着机器学习变得越来越普遍,它的软件包也越来越容易使用。一些低级的技术细节被抽象出来,并对实践者隐藏起来,这是很自然的,也是可取的。然而,这带来了一些风险,即实践者不知道设计决策,因此不知道机器学习算法的局限性。


有兴趣了解机器学习算法背后机制的实践者需要具备如下的先验知识:

  • 编程语言和数据分析工具

  • 大规模计算和相关框架

  • 数学和统计学知识,以及机器学习是如何基于这些知识构建的

 

在大学里,关于机器学习的入门课程往往会在课程的早期部分涉及到以上这些先验知识。由于历史原因,机器学习的课程倾向于在计算机科学系进行授课。在计算机科学系,学生通常在前两个知识领域受到的训练比较多,但在数学和统计学方面的训练较少。目前的一些机器学习教科书试图加入一到两章的内容来介绍数学背景知识,但是这些介绍要么在书的开头,要么作为附录。本书将机器学习中的数学基础知识放在首位,并且信息相对集中。

 

为什么要写一本关于机器学习的书?


机器学习建立在数学语言的基础上,用来表达直观上显而易见但却难以形式化的概念。一旦正确地形式化,我们就可以使用数学工具来得出我们设计选择的结果。这使我们能够深入了解我们正在解决的任务以及智能的本质。全球数学系学生普遍抱怨的一个问题是,数学所涵盖的主题似乎与实际问题没有太多关联。我们认为机器学习是人们学习数学的一个明显而直接的动机。


作者希望这本书可以成为一本指导机器学习大量数学基础的指南。作者通过直接指出数学概念在基本机器学习问题中的有用性来激发对数学概念的需求。为了使书简短,许多细节和更先进的概念都被省略了。书中介绍了一些基本概念,以及这些概念如何适用于机器学习的大背景,读者可以找到大量的资源进行进一步研究。对于有数学背景的读者,这本书提供了一个简短但精确的机器学习入门介绍。书中只提供四个代表性的经典的机器学习算法示例。作者关注的是模型本身背后的数学概念,目的是阐明它们的抽象美。作者希望所有的读者都能对机器学习的基本问题有更深入的了解,并将机器学习的实际问题与数学模型的基本选择联系起来。


谁是目标受众


随着机器学习在社会中的广泛应用,作者相信每个人都应该对它的基本原理有一些了解。这本书是用学术数学的风格来写的,这使读者能够精确地了解机器学习背后的概念。作者鼓励不熟悉这种简洁的风格的读者坚持阅读下去,并牢记每个主题的目标。作者在整篇文章中都有标记和评论,希望这些评论能对读者提供一些有用的指导。此外,本书假定读者具备高中数学和物理中常用的数学知识。例如,导数和积分,以及二维或三维的几何向量。因此,本书的目标受众包括普通大学生、夜校生和机器学习在线课程的学习者等等。


目录


Part I: 数据基础

  1. Introduction and Motivation

  2. Linear Algebra

  3. Analytic Geometry

  4. Matrix Decompositions

  5. Vector Calculus

  6. Probability and Distribution

  7. Continuous Optimization

Part II: 机器学习问题

  1. When Models Meet Data

  2. Linear Regression

  3. Dimensionality Reduction with Principal Component Analysis

  4. Density Estimation with Gaussian Mixture Models

  5. Classification with Support Vector Machines

 

简介(Introduction)


本书分为两部分,第一部分是数学基础的讲解,第二部分是将第一部分的数学概念应用于基本的机器学习问题中,从而形成 “机器学习四大支柱”,如下图所示:


 


这本书的第一部分描述了关于机器学习系统的三个主要组成部分的数学概念和数学基础:数据、模型和学习。在本书中,作者假设数据已经被适当地转换成适合于阅读的数字表示形式,并被转换成计算机程序。在这本书中,作者认为数据是向量。模型是现实世界的简化版本,它捕获与任务相关的现实世界的各个方面。模型的用户需要理解模型没有捕捉到什么,从而理解模型的局限性。概括起来就是,作者使用领域知识将数据表示为向量。并选择一个合适的模型,要么使用概率方法,要么使用优化方法。采用数值优化的方法,对过去的数据进行学习,目的是它在看不见的数据上表现良好。

 

本书第二部分介绍了上图所示的机器学习四大支柱,如下表所示。表中的每一行区分了相关变量是连续的还是非连续的类别的问题。作者解释了如何将本书第一部分介绍的数学概念应用于机器学习算法的设计中。在第 8 章中,作者以数学的方式重述了机器学习的三个组成部分 (数据、模型和学习)。此外,作者还提供了一些建立实验设置的指南,以防止对机器学习系统过于乐观的评估。



此外,作者在第一部分提供了一些练习,这些练习大部分可以用笔和纸来完成。在第二部分中,作者提供了一些编程教程 (jupyter 记事本) 来探索在本书中讨论的机器学习算法的一些特性。


全书配套网站:https://mml-book.com



下载链接:
https://mml-book.github.io/book/mml-book.pdf

(本文经授权转载自专知:Quan_Zhuanzhi,点击阅读原文查看原文)


登录查看更多
26

相关内容

机器学习使用来自各种数学领域的工具。本文件试图提供一个概括性的数学背景,需要在入门类的机器学习,这是在加州大学伯克利分校被称为CS 189/289A。

https://people.eecs.berkeley.edu/~jrs/189/

我们的假设是读者已经熟悉多变量微积分和线性代数的基本概念(达到UCB数学53/54的水平)。我们强调,本文档不是对必备类的替代。这里介绍的大多数主题涉及的很少;我们打算给出一个概述,并指出感兴趣的读者更全面的理解进一步的细节。

请注意,本文档关注的是机器学习的数学背景,而不是机器学习本身。我们将不讨论特定的机器学习模型或算法,除非可能顺便强调一个数学概念的相关性。

这份文件的早期版本不包括校样。我们已经开始在一些证据中加入一些比较简短并且有助于理解的证据。这些证明不是cs189的必要背景,但可以用来加深读者的理解。

成为VIP会员查看完整内容
0
126

本备忘单是机器学习手册的浓缩版,包含了许多关于机器学习的经典方程和图表,旨在帮助您快速回忆起机器学习中的知识和思想。

这个备忘单有两个显著的优点:

  1. 清晰的符号。数学公式使用了许多令人困惑的符号。例如,X可以是一个集合,一个随机变量,或者一个矩阵。这是非常混乱的,使读者很难理解数学公式的意义。本备忘单试图规范符号的使用,所有符号都有明确的预先定义,请参见小节。

  2. 更少的思维跳跃。在许多机器学习的书籍中,作者省略了数学证明过程中的一些中间步骤,这可能会节省一些空间,但是会给读者理解这个公式带来困难,读者会在中间迷失。

成为VIP会员查看完整内容
0
136

题目: Machine Learning in Action

摘要: 这本书向人们介绍了重要的机器学习算法,介绍了使用这些算法的工具和应用程序,让读者了解它们在今天的实践中是如何使用的。大部分的机器学习书籍都是讨论数学,但很少讨论如何编程算法。这本书旨在成为从矩阵中提出的算法到实际运行程序之间的桥梁。有鉴于此,请注意这本书重代码轻数学。

代码下载链接: https://pan.baidu.com/s/1--8P9Hlp7vzJdvhnnhsDvw 提取码:vqhg

成为VIP会员查看完整内容
0
61

由Marc Peter Deisenroth,A Aldo Faisal和Cheng Soon Ong撰写的《机器学习数学基础》“Mathematics for Machine Learning” 最新版417页pdf版本已经放出,作者表示撰写这本书旨在激励人们学习数学概念。这本书并不打算涵盖前沿的机器学习技术,因为已经有很多书这样做了。相反,作者的目标是通过该书提供阅读其他书籍所需的数学基础。这本书分为两部分:数学基础知识和使用数学基础知识进行机器学习算法示例。值得初学者收藏和学习!

目录

Part I: 数据基础

  • Introduction and Motivation
  • Linear Algebra
  • Analytic Geometry
  • Matrix Decompositions
  • Vector Calculus
  • Probability and Distribution
  • Continuous Optimization

Part II: 机器学习问题

  • When Models Meet Data
  • Linear Regression
  • Dimensionality Reduction with Principal Component Analysis
  • Density Estimation with Gaussian Mixture Models
  • Classification with Support Vector Machines
成为VIP会员查看完整内容
0
106
小贴士
相关VIP内容
专知会员服务
97+阅读 · 2020年7月5日
专知会员服务
102+阅读 · 2020年6月15日
专知会员服务
42+阅读 · 2020年5月22日
机器学习速查手册,135页pdf
专知会员服务
136+阅读 · 2020年3月15日
【经典书】Python计算机视觉编程,中文版,363页pdf
专知会员服务
84+阅读 · 2020年2月16日
【2020新书】简明机器学习导论,电子书与500页PPT
专知会员服务
173+阅读 · 2020年2月7日
人工智能学习笔记,247页pdf
专知会员服务
100+阅读 · 2019年12月14日
【电子书】机器学习实战(Machine Learning in Action),附PDF
专知会员服务
61+阅读 · 2019年11月25日
相关论文
TinyBERT: Distilling BERT for Natural Language Understanding
Xiaoqi Jiao,Yichun Yin,Lifeng Shang,Xin Jiang,Xiao Chen,Linlin Li,Fang Wang,Qun Liu
8+阅读 · 2019年9月23日
Liang Yao,Chengsheng Mao,Yuan Luo
6+阅读 · 2019年9月11日
Kwonjoon Lee,Subhransu Maji,Avinash Ravichandran,Stefano Soatto
3+阅读 · 2019年4月23日
Yongqin Xian,Saurabh Sharma,Bernt Schiele,Zeynep Akata
10+阅读 · 2019年3月25日
Yong Wang,Xiao-Ming Wu,Qimai Li,Jiatao Gu,Wangmeng Xiang,Lei Zhang,Victor O. K. Li
8+阅读 · 2018年7月8日
Tong Yu,Branislav Kveton,Zheng Wen,Hung Bui,Ole J. Mengshoel
4+阅读 · 2018年4月26日
Dianqi Li,Xiaodong He,Qiuyuan Huang,Ming-Ting Sun,Lei Zhang
4+阅读 · 2018年4月3日
Ignasi Clavera,Anusha Nagabandi,Ronald S. Fearing,Pieter Abbeel,Sergey Levine,Chelsea Finn
7+阅读 · 2018年3月30日
Chaowei Xiao,Bo Li,Jun-Yan Zhu,Warren He,Mingyan Liu,Dawn Song
8+阅读 · 2018年1月15日
Top