AI新人必看 | 参数和超参数还分不清楚吗?

2018 年 9 月 15 日 机器学习算法与Python学习

计算机学科里有太多的术语,而且许多术语的使用并不一致。哪怕是相同的术语,不同学科的人理解一定有所不同。


比如说:“模型参数(model parameter)”和“模型超参数(model Hyperparameter)”。


对于初学者来说,这些没有明确定义的术语肯定很令人困惑。尤其是对于些来自统计学或经济学领域的人。


我们来仔细研究一下这些条款。


什么是模型参数?


模型参数是模型内部的配置变量,其值可以根据数据进行估计。


  • 模型在进行预测时需要它们。

  • 它们的值定义了可使用的模型。

  • 他们是从数据估计或获悉的。

  • 它们通常不由编程者手动设置。

  • 他们通常被保存为学习模型的一部分。


参数是机器学习算法的关键。它们通常由过去的训练数据中总结得出。


在经典的机器学习文献中,我们可以将模型看作假设,将参数视为对特定数据集的量身打造的假设。


最优化算法是估计模型参数的有效工具。


  • 统计:在统计学中,您可以假设一个变量的分布,如高斯分布。高斯分布的两个参数是平均值(μ)和标准偏差(西格玛)。这适用于机器学习,其中这些参数可以从数据中估算出来并用作预测模型的一部分。

  • 编程:在编程中,您可以将参数传递给函数。在这种情况下,参数是一个函数参数,它可能具有一个值范围之一。在机器学习中,您使用的特定模型是函数,需要参数才能对新数据进行预测。


模型是否具有固定或可变数量的参数决定了它是否可以被称为“参数”或“非参数”。


模型参数的一些示例包括:


  • 神经网络中的权重。

  • 支持向量机中的支持向量。

  • 线性回归或逻辑回归中的系数。


什么是模型超参数?


模型超参数是模型外部的配置,其值无法从数据中估计。


  • 它们通常用于帮助估计模型参数。

  • 它们通常由人工指定。

  • 他们通常可以使用启发式设置。

  • 他们经常被调整为给定的预测建模问题。


我们虽然无法知道给定问题的模型超参数的最佳值,但是我们可以使用经验法则,在其他问题上使用复制值,或通过反复试验来搜索最佳值。


当机器学习算法针对特定问题进行调整时(例如,使用网格搜索或随机搜索时),那么正在调整模型的超参数或顺序以发现导致最熟练的模型的参数预测。


  • “许多模型有不能从数据直接估计的重要参数。例如,在K近邻分类模型中......因为没有可用于计算适当值的分析公式,这种类型的模型参数被称为调整参数。”

    - 第64-65页,《应用预测模型》,2013


如果模型超参数被称为模型参数,会造成很多混淆。克服这种困惑的一个经验法则如下:


如果必须手动指定模型参数,那么它可能是一个模型超参数。


模型超参数的一些例子包括:


  • 训练神经网络的学习速率。

  • 用于支持向量机的C和sigma超参数。

  • K最近邻的K。


总之,模型参数是根据数据自动估算的。但模型超参数是手动设置的,并且在过程中用于帮助估计模型参数。


模型超参数通常被称为参数,因为它们是必须手动设置和调整的机器学习的一部分。


登录查看更多
2

相关内容

在贝叶斯统计中,超参数是先验分布的参数; 该术语用于将它们与所分析的基础系统的模型参数区分开。
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
190+阅读 · 2020年6月29日
【硬核书】可扩展机器学习:并行分布式方法
专知会员服务
81+阅读 · 2020年5月23日
【ACL2020-Google】逆向工程配置的神经文本生成模型
专知会员服务
16+阅读 · 2020年4月20日
模型压缩究竟在做什么?我们真的需要模型压缩么?
专知会员服务
27+阅读 · 2020年1月16日
谷歌机器学习速成课程中文版pdf
专知会员服务
143+阅读 · 2019年12月4日
吴恩达团队:神经网络如何正确初始化?
AI100
10+阅读 · 2019年5月15日
介绍高维超参数调整 - 优化ML模型的最佳实践
AI研习社
7+阅读 · 2019年4月17日
AI从业者必须了解的决策树指南
AI前线
7+阅读 · 2019年1月14日
Forge:如何管理你的机器学习实验
专知
11+阅读 · 2018年12月1日
深度学习超参数搜索实用指南
云栖社区
28+阅读 · 2018年10月14日
入门 | 深度学习模型的简单优化技巧
机器之心
9+阅读 · 2018年6月10日
比xgboost强大的LightGBM:调参指南(带贝叶斯优化代码)
数据挖掘入门与实战
23+阅读 · 2018年4月9日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
BAT机器学习面试1000题系列(第36~40题)
七月在线实验室
8+阅读 · 2017年10月3日
Arxiv
53+阅读 · 2018年12月11日
Arxiv
8+阅读 · 2018年11月21日
Arxiv
23+阅读 · 2018年10月24日
Neural Architecture Optimization
Arxiv
8+阅读 · 2018年9月5日
Arxiv
12+阅读 · 2018年9月5日
Feature Selection Library (MATLAB Toolbox)
Arxiv
7+阅读 · 2018年8月6日
Arxiv
3+阅读 · 2018年6月24日
Arxiv
8+阅读 · 2018年1月25日
VIP会员
相关资讯
吴恩达团队:神经网络如何正确初始化?
AI100
10+阅读 · 2019年5月15日
介绍高维超参数调整 - 优化ML模型的最佳实践
AI研习社
7+阅读 · 2019年4月17日
AI从业者必须了解的决策树指南
AI前线
7+阅读 · 2019年1月14日
Forge:如何管理你的机器学习实验
专知
11+阅读 · 2018年12月1日
深度学习超参数搜索实用指南
云栖社区
28+阅读 · 2018年10月14日
入门 | 深度学习模型的简单优化技巧
机器之心
9+阅读 · 2018年6月10日
比xgboost强大的LightGBM:调参指南(带贝叶斯优化代码)
数据挖掘入门与实战
23+阅读 · 2018年4月9日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
BAT机器学习面试1000题系列(第36~40题)
七月在线实验室
8+阅读 · 2017年10月3日
相关论文
Arxiv
53+阅读 · 2018年12月11日
Arxiv
8+阅读 · 2018年11月21日
Arxiv
23+阅读 · 2018年10月24日
Neural Architecture Optimization
Arxiv
8+阅读 · 2018年9月5日
Arxiv
12+阅读 · 2018年9月5日
Feature Selection Library (MATLAB Toolbox)
Arxiv
7+阅读 · 2018年8月6日
Arxiv
3+阅读 · 2018年6月24日
Arxiv
8+阅读 · 2018年1月25日
Top
微信扫码咨询专知VIP会员