https://www.worldscientific.com/page/pressroom/2018-07-31-01

这本书提供了一个机器学习和数据挖掘领域的数学分析。典型的计算机科学数学课程的数学分析部分省略了这些非常重要的思想和技术,这些思想和技术对于机器学习的专门领域是不可缺少的,以优化为中心,如支持向量机,神经网络,各种类型的回归,特征选择和聚类。本书适用于研究者和研究生,他们将从书中讨论的这些应用领域获益。

数学分析可以被松散地描述为数学的一个领域,其主要对象是研究函数及其关于极限的行为。术语“函数”指的是实参数实函数的广义集合,包括函数、运算符、测度等。在数学分析中,有几个发展良好的领域对机器学习产生了特殊的兴趣:拓扑(具有不同的风格:点集拓扑、组合拓扑和代数拓扑),赋范和内积空间的泛函分析(包括巴拿赫和希尔伯特空间),凸分析,优化,等等。此外,像测量和集成理论这样的学科在统计学中发挥着至关重要的作用,这是机器学习的另一个支柱,在计算机科学家的教育中缺乏。我们的目标是为缩小这一差距做出贡献,这是对研究感兴趣的人的一个严重障碍。机器学习和数据挖掘文献非常广泛,包括各种各样的方法,从非正式的到复杂的数学展示。然而,接近研究主题所需要的必要的数学背景通常以一种简洁和无动机的方式呈现,或者干脆就不存在。本卷机器学习的通常介绍,并提供(通过其应用章节,讨论优化,迭代算法,神经网络,回归,和支持向量机)的数学方面的研究。

成为VIP会员查看完整内容
0
75

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

机器学习是关于基于数据的学习、推理和行动。这是通过构建计算机程序来完成的,这些程序可以处理数据,提取有用的信息,对未知属性做出预测,并建议采取的行动或做出的决定。将数据分析变成机器学习的原因是,这个过程是自动化的,计算机程序是从数据中学习的。这意味着使用通用计算机程序,这些程序根据观察到的所谓训练数据自动调整程序的设置,以适应特定的应用程序环境。因此可以说,机器学习是一种通过实例编程的方式。机器学习的美妙之处在于,数据所代表的内容是非常随意的,我们可以设计出适用于不同领域的广泛实际应用的通用方法。我们通过下面的一系列例子来说明这一点。上述“通用计算机程序”是指数据的数学模型。也就是说,当我们开发和描述不同的机器学习方法时,我们使用的是数学语言。数学模型描述了与观测数据对应的相关数量或变量与感兴趣的属性(如预测、动作等)之间的关系。因此,模型是数据的紧凑表示,以精确的数学形式捕捉我们正在研究的现象的关键属性。使用哪个模型通常由机器学习工程师在查看可用数据时产生的见解和从业者对问题的总体理解来指导。在实践中实现该方法时,将该数学模型转换为可在计算机上执行的代码。然而,要理解计算机程序的实际作用,了解其基础数学也很重要。

这本书的目的是介绍监督机器学习,而不需要在该领域的任何经验。我们既关注基础的数学,也关注实践方面。本书是教科书,不是参考书,也不是编程手册。因此,它只包含一个仔细(但全面)的监督机器学习方法的选择,而没有编程代码。现在有许多精彩和证据确凿的代码包可用,我们深信,在很好地理解数学和内部运行的方法。在这本书中,我们从统计学的角度来讨论方法的统计特性。因此,它需要一些统计和概率论的知识,以及微积分和线性代数。我们希望,从头到尾阅读这本书将给读者一个良好的起点,作为一个机器学习工程师工作和/或继续在该学科的进一步研究。下图说明了章节之间的主要依赖关系。特别是在第二、三、四章中讨论了最基本的主题,我们建议读者先阅读这些章节,然后再阅读后面包含更高级的主题的章节(第5-9章)。第10章超越了机器学习的监督设置,第11章关注于设计一个成功的机器学习解决方案的一些更实际的方面,比前几章的技术性更少。最后,第十二章(由David Sumpter撰写)讨论了现代机器学习的某些伦理方面。

成为VIP会员查看完整内容
0
49

大量大维度数据是现代机器学习(ML)的默认设置。标准的ML算法,从支持向量机这样的内核方法和基于图的方法(如PageRank算法)开始,最初的设计是基于小维度的,在处理真实世界的大数据集时,即使不是完全崩溃的话,往往会表现失常。随机矩阵理论最近提出了一系列广泛的工具来帮助理解这种新的维数诅咒,帮助修复或完全重建次优算法,最重要的是提供了处理现代数据挖掘的新方向。本编著的主要目的是提供这些直觉,通过提供一个最近的理论和应用突破的随机矩阵理论到机器学习摘要。针对广泛的受众,从对统计学习感兴趣的本科生到人工智能工程师和研究人员,这本书的数学先决条件是最小的(概率论、线性代数和真实和复杂分析的基础是足够的):与随机矩阵理论和大维度统计的数学文献中的介绍性书籍不同,这里的理论重点仅限于机器学习应用的基本要求。这些应用范围从检测、统计推断和估计,到基于图和核的监督、半监督和非监督分类,以及神经网络: 为此,本文提供了对算法性能的精确理论预测(在不采用随机矩阵分析时往往难以实现)、大维度的洞察力、改进方法,以及对这些方法广泛适用于真实数据的基本论证。该专著中提出的大多数方法、算法和图形都是用MATLAB和Python编写的,读者可以查阅(https://github.com/Zhenyu-LIAO/RMT4ML)。本专著也包含一系列练习两种类型:短的练习与修正附加到书的最后让读者熟悉随机矩阵的基本理论概念和工具分析,以及长期指导练习应用这些工具进一步具体的机器学习应用程序。

https://zhenyu-liao.github.io/book/

成为VIP会员查看完整内容
0
46

在理论计算机科学、概率、机器学习、离散数学、优化和压缩感知等各个领域,对统计物理方法和概念的兴趣正在迅速增长。本课程将涵盖这一丰富而活跃的跨学科研究领域。

具体地说,我们将回顾统计物理方法对问题的处理,从图论(渗透、社区检测)到离散优化和约束满足(可满足性、着色性、二分法),再到推理和学习问题(神经网络中的学习、数据和网络的聚类、压缩感知或稀疏线性回归、低秩矩阵和张量分解等)。

本课程面向具有概率论和分析基础知识的所有自然科学和工程学科的研究生和研究人员。

这套课程将讨论概率模型,并关注来自统计、机器学习和使用统计物理工具和技术的约束优化的问题。重点将更多的是理论而不是实际,所以你已经被警告!我们的目标是展示一些统计物理学的方法是如何得到许多数学问题的精确答案的。正如阿基米德所指出的那样,一旦给出了这些答案,即使它们是通过启发式方法得到的,严格地证明它们也是一种更简单(但仍然不平凡)的方法。在过去的几十年里,理论物理和应用数学之间的兴趣和方法日益趋同,许多统计物理和计算机科学的理论和应用工作都依赖于自旋玻璃统计物理的联系。本讲座的目的是介绍进入这个快速发展的领域所必需的背景知识。

https://sphinxteam.github.io/EPFLDoctoralLecture2021/

成为VIP会员查看完整内容
0
30

《量子信息理论》这本书基本上是自成体系的,主要关注构成这门学科基础的基本事实的精确数学公式和证明。它是为研究生和研究人员在数学,计算机科学,理论物理学寻求发展一个全面的理解关键结果,证明技术,和方法,与量子信息和计算理论的广泛研究主题相关。本书对基础数学,包括线性代数,数学分析和概率论有一定的理解。第一章总结了这些必要的数学先决条件,并从这个基础开始,这本书包括清晰和完整的证明它提出的所有结果。接下来的每一章都包含了具有挑战性的练习,旨在帮助读者发展自己的技能,发现关于量子信息理论的证明。

这是一本关于量子信息的数学理论的书,专注于定义、定理和证明的正式介绍。它主要是为对量子信息和计算有一定了解的研究生和研究人员准备的,比如将在本科生或研究生的入门课程中涵盖,或在目前存在的关于该主题的几本书中的一本中。量子信息科学近年来有了爆炸性的发展,特别是在过去的二十年里。对这个问题的全面处理,即使局限于理论方面,也肯定需要一系列的书,而不仅仅是一本书。与这一事实相一致的是,本文所涉及的主题的选择并不打算完全代表该主题。量子纠错和容错,量子算法和复杂性理论,量子密码学,和拓扑量子计算是在量子信息科学的理论分支中发现的许多有趣的和基本的主题,在这本书中没有涵盖。然而,当学习这些主题时,人们很可能会遇到本书中讨论的一些核心数学概念。

https://www.cambridge.org/core/books/theory-of-quantum-information/AE4AA5638F808D2CFEB070C55431D897#fndtn-information

成为VIP会员查看完整内容
0
46

这本书的目的是介绍计算机科学家所需要的一些基本数学知识。读者并不期望自己是数学家,我们希望下面的内容对你有用。

成为VIP会员查看完整内容
0
73

图论和组合优化之间的融合已经导致了理论深刻和实际有用的算法,但目前没有一本书同时涵盖这两个领域。《图论、组合优化和算法手册》是第一本对图论和组合优化进行统一、全面处理的书。

地址:

https://www.routledge.com/Handbook-of-Graph-Theory-Combinatorial-Optimization-and-Algorithms/Thulasiraman-Arumugam-Brandstadt-Nishizeki/p/book/9781584885955

分为11个章节,集中在图论,组合优化和算法问题。本书为读者提供了算法和理论基础:

理解由图结构形成的现象 为图结构的研究开发所需的算法和优化工具 设计和规划导致某些理想行为的图形结构

有来自40多个世界各地的专家的贡献,这本手册配备读者必要的技术和工具,以解决各种应用中的问题。读者可以接触到图论和组合优化的广泛主题的理论和算法基础,使他们能够识别(并因此解决)在不同学科中遇到的问题,如电气、通信、计算机、社会、交通、生物和其他网络。

图论和组合优化的研究在过去的三十年左右经历了爆炸性的增长。电信网络、大规模集成电路设计等技术突飞猛进;网络科学等新领域的出现强调了在社会网络和生物网络中的应用;理论计算机科学的进步都促进了图论、组合优化和相关算法问题的兴趣和知识的爆炸。因此,毫不奇怪,这些学科已经成为工程和计算机科学课程的中心角色。现在有几本关于图论或组合优化的优秀教科书。这些书大致可以分为两类。第一类是处理图论或组合优化中所有基本主题的书籍。这些书是供大四本科生和初学研究生使用的教科书。第二类是对某些特定主题进行深入探讨的书籍。它们适合那些打算从事图论或组合优化研究的学生。由于这些学科已经达到了一定的成熟水平,我们认为需要一本对图论和组合优化提供更广泛和综合处理的书。这样的一本书将帮助学生和研究人员装备自己的技术和工具,将加强他们的能力,看到机会应用图论和组合优化解决他们在应用中遇到的问题。我们多年来在教学和应用图论和组合优化方面的经验使我们相信,虽然工具和技术能提高一个人解决问题的能力,但更广泛地接触它们也能帮助个人看到其他情况下看不到的问题。

成为VIP会员查看完整内容
0
64

优化和机器学习的相互作用是现代计算科学最重要的发展之一。优化的公式和方法在设计从大量数据中提取基本知识的算法方面被证明是至关重要的。然而,机器学习并不仅仅是优化技术的消费者,而是一个快速发展的领域,它本身也在产生新的优化思想。这本书以一种对两个领域的研究人员都可访问的方式捕获了优化和机器学习之间交互的艺术的状态。

优化方法因其广泛的适用性和吸引人的理论特性而在机器学习中占有重要地位。当今机器学习模型的复杂性、规模和多样性日益增加,需要对现有假设进行重新评估。这本书开始了重新评估的过程。它描述了在诸如一阶方法,随机近似,凸松弛,内点方法,和近端方法等已建立的框架。它还专门关注一些新的主题,如正则化优化、鲁棒优化、梯度和次梯度方法、分裂技术和二阶方法。其中许多技术的灵感来自其他领域,包括运筹学、理论计算机科学和优化子领域。这本书将丰富机器学习社区和这些其他领域以及更广泛的优化社区之间正在进行的交叉发展。

成为VIP会员查看完整内容
0
71

本书涵盖了这些领域中使用Python模块演示的概率、统计和机器学习的关键思想。整本书包括所有的图形和数值结果,都可以使用Python代码及其相关的Jupyter/IPython Notebooks。作者通过使用多种分析方法和Python代码的有意义的示例,开发了机器学习中的关键直觉,从而将理论概念与具体实现联系起来。现代Python模块(如panda、y和Scikit-learn)用于模拟和可视化重要的机器学习概念,如偏差/方差权衡、交叉验证和正则化。许多抽象的数学思想,如概率论中的收敛性,都得到了发展,并用数值例子加以说明。本书适合任何具有概率、统计或机器学习的本科生,以及具有Python编程的基本知识的人。

成为VIP会员查看完整内容
0
145

高斯过程(GPs)为核机器的学习提供了一种有原则的、实用的、概率的方法。在过去的十年中,GPs在机器学习社区中得到了越来越多的关注,这本书提供了GPs在机器学习中理论和实践方面长期需要的系统和统一的处理。该书是全面和独立的,针对研究人员和学生在机器学习和应用统计学。

这本书处理监督学习问题的回归和分类,并包括详细的算法。提出了各种协方差(核)函数,并讨论了它们的性质。从贝叶斯和经典的角度讨论了模型选择。讨论了许多与其他著名技术的联系,包括支持向量机、神经网络、正则化网络、相关向量机等。讨论了包括学习曲线和PAC-Bayesian框架在内的理论问题,并讨论了几种用于大数据集学习的近似方法。这本书包含说明性的例子和练习,和代码和数据集在网上是可得到的。附录提供了数学背景和高斯马尔可夫过程的讨论。

成为VIP会员查看完整内容
0
119

本备忘单是机器学习手册的浓缩版,包含了许多关于机器学习的经典方程和图表,旨在帮助您快速回忆起机器学习中的知识和思想。

这个备忘单有两个显著的优点:

  1. 清晰的符号。数学公式使用了许多令人困惑的符号。例如,X可以是一个集合,一个随机变量,或者一个矩阵。这是非常混乱的,使读者很难理解数学公式的意义。本备忘单试图规范符号的使用,所有符号都有明确的预先定义,请参见小节。

  2. 更少的思维跳跃。在许多机器学习的书籍中,作者省略了数学证明过程中的一些中间步骤,这可能会节省一些空间,但是会给读者理解这个公式带来困难,读者会在中间迷失。

成为VIP会员查看完整内容
0
194
小贴士
相关VIP内容
专知会员服务
46+阅读 · 8月12日
专知会员服务
30+阅读 · 8月4日
专知会员服务
46+阅读 · 8月4日
专知会员服务
73+阅读 · 7月27日
专知会员服务
71+阅读 · 2月26日
专知会员服务
145+阅读 · 2020年6月3日
专知会员服务
119+阅读 · 2020年5月2日
机器学习速查手册,135页pdf
专知会员服务
194+阅读 · 2020年3月15日
相关论文
Corinna Cortes,Neil D. Lawrence
0+阅读 · 9月20日
Zirui Wang,Adams Wei Yu,Orhan Firat,Yuan Cao
0+阅读 · 9月19日
Peter L. Bartlett,Andrea Montanari,Alexander Rakhlin
14+阅读 · 3月16日
Type-augmented Relation Prediction in Knowledge Graphs
Zijun Cui,Pavan Kapanipathi,Kartik Talamadupula,Tian Gao,Qiang Ji
6+阅读 · 2020年9月16日
Emmanuel Bengio,Joelle Pineau,Doina Precup
8+阅读 · 2020年3月13日
Ting Chen,Simon Kornblith,Mohammad Norouzi,Geoffrey Hinton
18+阅读 · 2020年2月13日
Linfeng Song,Zhiguo Wang,Mo Yu,Yue Zhang,Radu Florian,Daniel Gildea
6+阅读 · 2018年9月6日
Feature Selection Library (MATLAB Toolbox)
Giorgio Roffo
3+阅读 · 2018年8月6日
Sergey Edunov,Myle Ott,Michael Auli,David Grangier,Marc'Aurelio Ranzato
6+阅读 · 2018年5月24日
Top