【资源】这本开放书籍帮你扫清通往ML的数学绊脚石

2018 年 10 月 28 日 机器学习算法与Python学习

源|机器之心


数学是机器学习的基础。斯坦福大学教授 Stephen Boyd 联合加州大学洛杉矶分校的 Lieven Vandenberghe 教授出版了一本基础数学书籍,从向量到最小二乘法,分三部分进行讲解并配以辅助资料。此外,这本书也是斯坦福 EE103 课程、UCLA EE133A 课程的教材,由剑桥大学出版社出版(允许网络公开)。


项目地址:https://web.stanford.edu/~boyd/vmls/(下载见文末!)


这一本书的资料还是比较齐全的,除了本身 473 页的教材,还有另一本 178 页的对应代码讲解。当然如果读者只需要了解数学部分的话,代码部分是不需要了解的。但是如果比较关注线性代数的应用,可能就需要阅读这些基础代码,并顺便学一学 Julia 语言了。最后,这一本书还提供了对应的课程 PPT,读者也可以把它们作为辅助资料。


书籍简介


这本书旨在介绍向量、矩阵和最小二乘方法等应用线性代数的基础内容,它的目标是为只有很少或根本没有线性代数基础的初学者提供入门方法,包括线性代数的基本思想以及在数据科学和机器学习等领域的应用方法。


不过读者还是需要熟悉一般的数学符号,并且在一些地方也会用到微积分,但它们并不起关键作用,因此基本上以前学过高数就差不多了。这本书包含了很多传统概率论与统计学所讨论的话题,例如使用数学模型拟合数据等,但读者不一定需要这一方面的背景知识。


这本书比一般的应用线性代数课本要有更少的数学成分,只会详细介绍基本线性代数、线性独立性等理论概念,以及 QR 因式分解这一计算工具。而这本书讨论的大多数机器学习等方面的应用只会使用一种方法,即最小二乘法及其扩展。在某种意义下,该书更强调的是应用,即依赖于少量基本数学概念和方法,而覆盖大多数应用。但是这本书所呈现的数学是完整的,因为它会仔细证明每一个数学声明。然而,与大多数介绍性的线性代数课本相比,这本书描述了许多实际应用。包括一些通常被认为是高级主题的应用,如文档分类、状态估计和投资组合优化等。


这本书并不需要任何计算机编程的知识,因此可以作为传统的教学课程,我们只需要阅读对应章节并完成一些不涉及数值计算的练习题就行了。然而,这种方法会并不能使我们完全理解这本书,同时也得不到实际锻炼,例如我们可以使用这本书的观点与方法构建一个基于数据的预测模型、增强图像数据或优化投资组合等。随着计算力的不断增长,以及 NumPy 等高效矩阵运算库的发展,这本书中的描述的方法可以轻松地应用到实践中。因此读者还可以使用 Python 等编程语言练习不同的项目而补充学习资源,只有使用真实数据搭建应用才能真切地理解理论思想。本书提供了一些需要数值计算的练习题,且数据文件与编程语言的资源都可在线获得。


这本书主要分为三部分。第一部分介绍了向量及各种向量运算和函数,例如加法、向量内积、距离和角度等。本书还展示了如何使用向量表示文档中的词数、时间序列、目标属性、产品规格、音频数据和图像等。第二部分如同前一部分重点关注矩阵的概念与应用,包括矩阵的求逆和解线性方程等。第三部分介绍了最小二乘法,它不仅展示了如何简单而自然地近似求解一个超定方程组,同时还有一些可应用到很多方法的最小二乘扩展知识。


该书还可用于自学,并辅以在线提供的资料,例如下面这份 470 页的 PPT。


地址:https://web.stanford.edu/~boyd/vmls/vmls-slides.pdf(下载见文末)


按照设计,本书的进度会逐渐加快,也就是说第一部分和第二部分有许多细节和简单的例子,第三部分有更多高级的例子和应用。对于只有很少线性代数基础或根本没有的读者而言,课程可以侧重于第一部分和第二部分,并且仅简单了解一些更高级的应用。而熟悉背景知识的读者可以快速过一遍前面两部分,并将重点放在最后的应用部分上。



最后,这本书的对应代码和数据都可以在 GitHub 中找到:https://github.com/VMLS-book(下载见文末)。



书籍+PPT+代码

下载方式

关注公众号,后台回复

20181028



推荐阅读

互联网公司时尚穿搭指南

最强NLP预训练模型!谷歌BERT横扫11项NLP任务记录

朴素贝叶斯详解及中文舆情分析(附代码实践)

【代码集合】深度强化学习Pytorch实现集锦

pandas入门教程

【资源】机器学习算法工程师手册(PDF下载)


登录查看更多
55

相关内容

线性代数(Linear Algebra)是数学的一个分支,它的研究对象是向量,向量空间(或称线性空间),线性变换和有限维的线性方程组。向量空间是现代数学的一个重要课题;因而,线性代数被广泛地应用于抽象代数和泛函分析中;通过解析几何,线性代数得以被具体表示。线性代数的理论已被泛化为算子理论。由于科学研究中的非线性模型通常可以被近似为线性模型,使得线性代数被广泛地应用于自然科学和社会科学中。 - 题图来自「维基百科」。
【经典书】机器学习:贝叶斯和优化方法,1075页pdf
专知会员服务
388+阅读 · 2020年6月8日
最新《机器学习理论初探》概述
专知会员服务
42+阅读 · 2020年5月19日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
223+阅读 · 2020年5月2日
《深度学习》圣经花书的数学推导、原理与Python代码实现
【电子书】机器学习实战(Machine Learning in Action),附PDF
专知会员服务
123+阅读 · 2019年11月25日
【资源】机器学习数学全书,1900页PDF下载
全球人工智能
146+阅读 · 2019年10月17日
421页《机器学习数学基础》最新2019版PDF下载
那些值得推荐和收藏的线性代数学习资源
381页机器学习数学基础PDF下载
专知
88+阅读 · 2018年10月9日
机器学习实践指南
Linux中国
8+阅读 · 2017年9月28日
Arxiv
19+阅读 · 2018年6月27日
Arxiv
25+阅读 · 2018年1月24日
VIP会员
相关资讯
【资源】机器学习数学全书,1900页PDF下载
全球人工智能
146+阅读 · 2019年10月17日
421页《机器学习数学基础》最新2019版PDF下载
那些值得推荐和收藏的线性代数学习资源
381页机器学习数学基础PDF下载
专知
88+阅读 · 2018年10月9日
机器学习实践指南
Linux中国
8+阅读 · 2017年9月28日
Top
微信扫码咨询专知VIP会员