机器学习简明指南,不可错过!

A Machine Learning Primer

亚马逊研究科学家Mihail Eric关于机器学习实践重要经验。包括监督学习、机器学习实践、无监督学习以及深度学习。具体为:

监督学习

  • 线性回归
  • 逻辑回归
  • 朴素贝叶斯
  • 支持向量机
  • 决策树
  • K-近邻

机器学习实践

  • 偏差-方差权衡
  • 如何选择模型
  • 如何选择特征
  • 正则化你的模型
  • 模型集成
  • 评价指标

无监督学习

  • 市场篮子分析
  • K均值聚类
  • 主成分分析

深度学习

  • 前向神经网络
  • 神经网络实践
  • 卷积神经网络
  • 循环神经网络
成为VIP会员查看完整内容
0
27

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

本书基于易于理解且具有数据科学相关的丰富的库的Python语言环境,从零开始讲解数据科学工作。具体内容包括:Python速成,可视化数据,线性代数,统计,概率,假设与推断,梯度下降法,如何获取数据,k近邻法,朴素贝叶斯算法,等等。作者借助大量具体例子以及数据挖掘、统计学、机器学习等领域的重要概念,详细展示了什么是数据科学。

介绍数据科学基本知识的重量级读本,Google数据科学家作品。

数据科学是一个蓬勃发展、前途无限的行业,有人将数据科学家称为“21世纪头号性感职业”。本书从零开始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识——数学和统计学。

作者选择了功能强大、简单易学的Python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好、简洁易读的实现范例。书中涵盖的所有代码和数据都可以在GitHub上下载。

  • 简单介绍Python
  • 回顾一下线性几何、统计和概率知识,了解搞数据科学的时候怎么使用它们
  • 收集、探索、清理、转换和操作数据
  • 了解机器学习的基本知识
  • 实现K近邻、朴素贝叶斯、线性及逻辑回归、决策树、神经网络及聚类等模型
  • 探索推荐系统、自然语言处理、网络分析、MapReduce,还有数据库
成为VIP会员查看完整内容
0
26

Python中的数据科学和分析是为学术和商业环境中的数据科学和数据分析从业者设计的。其目的是通过使用Python开发的工具(如SciKit-learn、Pandas、Numpy等)向读者介绍数据科学中使用的主要概念。鉴于Python最近在数据科学社区的流行,它的使用特别有趣。有经验的程序员和新手都可以使用这本书。

本书的组织方式是各个章节相互独立,这样读者就可以放心地使用其中的内容作为参考。这本书从过程和获得的结果的角度讨论了什么是数据科学和分析。还介绍了Python的重要特性,包括Python入门。机器学习、模式识别和人工智能的基本元素在书的其余部分使用的算法和实现的基础上也出现在书的第一部分。

本书的第二部分介绍了使用Python、聚类技术和分类算法的回归分析。层次聚类、决策树和集成技术,以及降维技术和推荐系统也被探讨。书的最后一部分讨论了支持向量机算法和内核技巧。

成为VIP会员查看完整内容
0
25

管理统计和数据科学的原理包括:数据可视化;描述性措施;概率;概率分布;数学期望;置信区间;和假设检验。方差分析;简单线性回归;多元线性回归也包括在内。另外,本书还提供了列联表、卡方检验、非参数方法和时间序列方法。

教材:

  • 包括通常在入门统计学课程中涵盖的学术材料,但与数据科学扭曲,较少强调理论
  • 依靠Minitab来展示如何用计算机执行任务
  • 展示并促进来自开放门户的数据的使用
  • 重点是发展对程序如何工作的直觉
  • 让读者了解大数据的潜力和目前使用它的失败之处
成为VIP会员查看完整内容
0
48

Python是金融业中使用的最流行的编程语言之一,具有大量的配套库。

在这本书中,您将介绍下载金融数据和为建模做准备的不同方法。你将计算技术分析中常用的指标,如波林格波段、MACD、RSI和backtest自动交易策略。接下来,您将学习时间序列分析和模型,例如指数平滑、ARIMA和GARCH(包括多元规范),然后介绍流行的CAPM和Fama-French三因素模型。然后,您将了解如何优化资产配置,并将蒙特卡洛模拟用于计算美国期权价格和估计风险价值(VaR)等任务。在后面的章节中,您将完成金融领域的整个数据科学项目。您还将学习如何使用高级分类器(如random forest、XGBoost、LightGBM和堆叠模型)解决信用卡欺诈和默认问题。然后您就可以调优模型的超参数并处理类的不平衡。最后,您将学习如何使用深度学习(PyTorch)来处理财务任务。

在本书的末尾,您将学会如何使用基于收据的方法有效地分析财务数据。

https://www.packtpub.com/data/python-for-finance-cookbook

成为VIP会员查看完整内容
0
55

这本教科书通过提供实用的建议,使用直接的例子,并提供相关应用的引人入胜的讨论,以一种容易理解的方式介绍了基本的机器学习概念。主要的主题包括贝叶斯分类器,最近邻分类器,线性和多项式分类器,决策树,神经网络,和支持向量机。后面的章节展示了如何通过“推进”的方式结合这些简单的工具,如何在更复杂的领域中利用它们,以及如何处理各种高级的实际问题。有一章专门介绍流行的遗传算法。

这个修订的版本包含关于工业中机器学习的实用应用的关键主题的三个全新的章节。这些章节研究了多标签域,无监督学习和它在深度学习中的使用,以及归纳逻辑编程的逻辑方法。许多章节已经被扩展,并且材料的呈现已经被增强。这本书包含了许多新的练习,许多解决的例子,深入的实验,和独立工作的计算机作业。

https://link.springer.com/book/10.1007/978-3-319-63913-0#about

成为VIP会员查看完整内容
0
74

本书涵盖了这些领域中使用Python模块演示的概率、统计和机器学习的关键思想。整本书包括所有的图形和数值结果,都可以使用Python代码及其相关的Jupyter/IPython Notebooks。作者通过使用多种分析方法和Python代码的有意义的示例,开发了机器学习中的关键直觉,从而将理论概念与具体实现联系起来。现代Python模块(如panda、y和Scikit-learn)用于模拟和可视化重要的机器学习概念,如偏差/方差权衡、交叉验证和正则化。许多抽象的数学思想,如概率论中的收敛性,都得到了发展,并用数值例子加以说明。本书适合任何具有概率、统计或机器学习的本科生,以及具有Python编程的基本知识的人。

成为VIP会员查看完整内容
0
81

近年来,神经网络已成为分析复杂和抽象数据模型的有力工具。然而,它们的引入本质上增加了我们的不确定性,即分析的哪些特征是与模型相关的,哪些是由神经网络造成的。这意味着,神经网络的预测存在偏差,无法与数据的创建和观察的真实本质区分开来。为了尝试解决这些问题,我们讨论了贝叶斯神经网络:可以描述由网络引起的不确定性的神经网络。特别地,我们提出了贝叶斯统计框架,它允许我们根据观察某些数据的根深蒂固的随机性和我们缺乏关于如何创建和观察数据的知识的不确定性来对不确定性进行分类。在介绍这些技术时,我们展示了如何从原理上获得神经网络预测中的误差,并提供了描述这些误差的两种常用方法。我们还将描述这两种方法在实际应用时如何存在重大缺陷,并强调在使用神经网络时需要其他统计技术来真正进行推理。

成为VIP会员查看完整内容
0
58

获得高级数据分析概念的广泛基础,并发现数据库中的最新革命,如Neo4j、Elasticsearch和MongoDB。这本书讨论了如何实现ETL技术,包括主题爬行,这是应用在诸如高频算法交易和面向目标的对话系统等领域。您还将看到机器学习概念的示例,如半监督学习、深度学习和NLP。使用Python的高级数据分析还包括时间序列和主成分分析等重要的传统数据分析技术。

读完这本书,你将对分析项目的每个技术方面都有了经验。您将了解使用Python代码的概念,并提供在您自己的项目中使用的示例。

你会学到什么

  • 使用数据分析技术,如分类、聚类、回归和预测
  • 处理结构化和非结构化数据、ETL技术以及不同类型的数据库,如Neo4j、Elasticsearch、MongoDB和M- ySQL
  • 考察不同的大数据框架,包括Hadoop和Spark
  • 发现先进的机器学习概念,如半监督学习,深度学习,和NLP

这本书是给谁看的

对数据分析领域感兴趣的数据科学家和软件开发人员。

成为VIP会员查看完整内容
0
77

本书通过提供真实的案例研究和示例,为使用Python库进行机器学习提供了坚实的基础。它涵盖了诸如机器学习基础、Python入门、描述性分析和预测分析等主题。包括高级机器学习概念,如决策树学习、随机森林、增强、推荐系统和文本分析。这本书在理论理解和实际应用之间采取了一种平衡的方法。所有的主题都包括真实世界的例子,并提供如何探索、构建、评估和优化机器学习模型的逐步方法。

成为VIP会员查看完整内容
Machine Learning using Python by Manaranjan Pradhan.pdf
0
139

书名: Hands-On Machine Learning with Scikit-Learn and TensorFlow

主要内容:

这本书分为两个部分。

第一部分,机器学习的基础知识,涵盖以下主题:

  • 什么是机器学习?它被试图用来解决什么问题?机器学习系统的主要类别和基本概念是什么?
  • 典型的机器学习项目中的主要步骤。
  • 通过拟合数据来学习模型。
  • 优化成本函数(cost function)。
  • 零、前言
  • 处理,清洗和准备数据。
  • 选择和设计特征。
  • 使用交叉验证选择一个模型并调整超参数。
  • 机器学习的主要挑战,特别是欠拟合和过拟合(偏差和方差权衡)。
  • 对训练数据进行降维以对抗 the curse of dimensionality(维度诅咒)
  • 最常见的学习算法:线性和多项式回归, Logistic 回归,k-最近邻,支持向量机,决策 树,随机森林和集成方法。

第二部分,神经网络和深度学习,包括以下主题:

  • 什么是神经网络?它们有啥优势?
  • 使用 TensorFlow 构建和训练神经网络。
  • 最重要的神经网络架构:前馈神经网络,卷积网络,递归网络,长期短期记忆网络 (LSTM)和自动编码器。
  • 训练深度神经网络的技巧。
  • 对于大数据集缩放神经网络。
  • 强化学习。

第一部分主要基于 scikit-learn ,而第二部分则使用 TensorFlow 。 注意:不要太急于深入学习到核心知识:深度学习无疑是机器学习中最令人兴奋的领域之 一,但是你应该首先掌握基础知识。而且,大多数问题可以用较简单的技术很好地解决(而 不需要深度学习),比如随机森林和集成方法(我们会在第一部分进行讨论)。如果你拥有 足够的数据,计算能力和耐心,深度学习是最适合复杂的问题的,如图像识别,语音识别或 自然语言处理。

成为VIP会员查看完整内容
Hands on Machine Learning with Scikit Learn and TensorFlow - 中文版.pdf
0
46
小贴士
相关VIP内容
专知会员服务
26+阅读 · 9月20日
专知会员服务
25+阅读 · 8月22日
专知会员服务
48+阅读 · 7月29日
【干货书】《机器学习导论(第二版)》,348页pdf
专知会员服务
74+阅读 · 6月16日
专知会员服务
58+阅读 · 6月3日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
139+阅读 · 3月17日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
46+阅读 · 3月15日
相关论文
Optimization for deep learning: theory and algorithms
Ruoyu Sun
62+阅读 · 2019年12月19日
Multi-class Classification without Multi-class Labels
Yen-Chang Hsu,Zhaoyang Lv,Joel Schlosser,Phillip Odom,Zsolt Kira
4+阅读 · 2019年1月2日
Parsimonious Bayesian deep networks
Mingyuan Zhou
3+阅读 · 2018年10月17日
Physical Primitive Decomposition
Zhijian Liu,William T. Freeman,Joshua B. Tenenbaum,Jiajun Wu
3+阅读 · 2018年9月13日
Alexander Jung
6+阅读 · 2018年8月19日
Adrià Garriga-Alonso,Laurence Aitchison,Carl Edward Rasmussen
3+阅读 · 2018年8月16日
Ken C. L. Wong,Tanveer Syeda-Mahmood,Mehdi Moradi
4+阅读 · 2018年8月15日
Marc Tanti,Albert Gatt,Kenneth P. Camilleri
3+阅读 · 2018年3月14日
Jun Wang,Afonso Arriaga,Qiang Tang,Peter Y. A. Ryan
5+阅读 · 2018年2月7日
Anastasia Pentina,Christoph H. Lampert
3+阅读 · 2017年6月8日
Top