干货|掌握机器学习数学基础之优化[1]（重点知识）

会员服务 ·

干货|掌握机器学习数学基础之优化[1]（重点知识）

2017 年 11 月 19 日 机器学习研究会

推荐阅读时间：8~15min

主要内容（下划线部分）：

1、计算复杂性与NP问题

2、上溢和下溢

3、导数，偏导数及两个特殊矩阵

4、函数导数为零的二三事

5、方向导数和梯度

6、梯度有什么用

7、梯度下降法

8、牛顿法

计算复杂性与NP问题

算法的复杂性：现实中大多数问题都是离散的数据集，为了反映统计规律，有时数据量很大，而且多数目标函数都不能简单地求得解析解。而为了记录在解决问题的算法的性能或者说好坏，就引入了算法的复杂性。

算法理论被认为是解决各类现实问题的方法论。而衡量算法理论的计算复杂度可分为：时间复杂度和空间复杂度，这是对算法执行所需要的两类资源——时间和空间的估算。其中，算法的时间复杂度是一个函数，它定性描述了该算法的运行时间，空间复杂度是对一个算法在运行过程中临时占用存储空间大小的量度

另为，一般的，衡量问题是否可解的重要指标是：该问题能否在多项式时间内求解，还是只能在指数时间内求解？在各类算法理论中，通常使用多项式时间算法即可解决的问题看作是易解问题，需要指数时间算法解决的问题看作是难解问题。

指数时间算法的计算时间随着问题规模的增长而呈指数化上升，这类问题虽然有解，但并不适用于大规模问题。所以当前算法研究的一个重要任务就是将指数时间算法变换为多项式时间算法。

确定性和非确定性 ：除了问题规模与运算时间的比较，衡量一个算法还需要考虑确定性和非确定性的概念。

先说说自动机：是有限状态机(FSM)的数学模型。实际上是指一种基于状态变化进行迭代的算法。也就是在给定输入和状态时，自动机的状态会发生改变的模型。在算法领域常把这类算法看作一个机器，比较知名的有图灵机、玻尔兹曼机、支持向量机等。或者，在日常生活中的自动售卖机就是一种有限状态机。

确定性：所谓确定性，是指针对各种自动机模型，根据当时的状态和输入，若自动机的状态转移是唯一确定的，则称具有确定性；

非确定性：若在某一时刻自动机有多个状态可供选择，并尝试执行每个可选择的状态，则称具有不确定性。

换个说法就是：确定性是程序每次运行时产生下一步的结果是唯一的，因此返回的结果也是唯一的；非确定性是程序在每个运行时执行的路径是并行且随机的，所有路径都可能返回结果，也可能只有部分返回结果，也可能不返回结果，但是只要有一个路径返回结果，那么算法就结束。

NP问题：简单的说，存在多项式时间的算法的一类问题，称之为P类问题；在多项式时间内可由非确定机解决的一类问题，称之为NP问题。另外，很多人相信P类问题是NP问题的一个子集，但既没有人证明出有某个问题属于NP但不属于P，也没有人证明所有NP问题都能在多项式时间内有解，如图：