【荐书】机器学习最热书单Top10,附深度学习等7大领域132本书目

2018 年 8 月 18 日 新智元
【荐书】机器学习最热书单Top10,附深度学习等7大领域132本书目




  新智元报道 

来源:GitHub 

作者:三石,肖琴


【新智元导读掌握一个领域的知识需要系统的去学习,只通过一本书所学到的知识是远远不够的。此外,除了与该领域相关的技术,对应的产业发展也是格外重要。本文便以机器学习为例,由浅入深,并结合相关领域其它技术、产业等方面,为读者推荐了丰富的书目资源。



一张“迷你地图”,教你如何进击机器学习!


由图可见,想要进击机器学习,成为机器学习方面的专家,那么你需要从入门、深度学习、数据科学、R语言、Python、金融、专家级等多方面的书目,循序渐进的进行修炼。


话不多说,来看与机器学习相关,最受欢迎的书目榜单Top10吧!


1、《Scikit-Learn 与 TensorFlow 机器学习实用指南》




英文书名:Hands-On Machine Learning with Scikit-Learn and TensorFlow

作者:Aurélien Géron

出版社:O'Reilly Media


这本书通过具体的例子、很少的理论以及两款成熟的Python框架:Scikit—Learn和TensorFlow,帮助你掌握构建智能系统所需要的概念和工具。你将会学习到各种技术,从简单的线性回归到深度神经网络。每章的练习有助于你运用所学到的知识,你只需要有一些编程经验就行了。


从这本书你将学习:

  • 探索机器学习环境,特别是神经网络

  • 使用scikit-learn跟踪端到端的示例机器学习项目

  • 探索几种训练模型,包括支持向量机、决策树、随机森林和集合方法

  • 使用TensorFlow库构建和训练神经网络

  • 深入研究神经网络架构,包括卷积网络,循环网络和深度强化学习

  • 学习训练和scaling深度神经网络的技巧

  • 应用实际代码示例,而无需学习过多的机器学习理论或算法细节


2、《面向数据科学家的实用统计学》



英文书名:Practical Statistics for Data Scientists: 50 Essential Concepts

作者:Peter Bruce & Andrew Bruce

出版社:O'Reilly Media


很多数据科学资源包括了统计方法,但是欠缺具有深度的统计学视角。如果你熟悉R语言编程,也对统计学有所了解,这份快速参考将帮助你搭建易学可达的知识桥梁。


从这本书你将学到:

  • 为什么探索性数据分析是数据科学的关键步骤

  • 随机抽样如何减少偏差,并产生更高质量的数据集,即使对于大数据也能如此

  • 实验设计原则如何有助于得到问题的最终答案

  • 如何使用回归来估计结果并检测异常

  • 用于预测一个record属于哪个类别的关键分类技术

  • 从数据中“学习”的统计机器学习方法

  • 用于从未标记数据中提取含义的无监督学习方法


3、Python深度学习



英文书名:Deep Learning with Python

作者:Francois Chollet

出版社:Manning Publications


本书介绍使用Python语言和强大的Keras库深入深度学习领域。本书由Keras作者、Google AI研究员François Chollet撰写,通过直观的解释和实际例子帮助读者理解。你将在计算机视觉、自然语言处理和生成模型中应用具有挑战性的概念和实践。当学完本书时,你将拥有在自己的项目中应用深度学习的知识和实践技能。


从本书你将学习:

  • 深度学习的基本原则

  • 建立自己的深度学习环境

  • 图像分类模型

  • 文本和序列的深度学习

  • 神经风格迁移、文本生成和图像生成


4、《深度学习》



英文书名:Deep Learning

作者:Ian Goodfellow, Yoshua Bengio & Aaron Courville

出版社:The MIT Press


这本“花书”被认为是名副其实的AI圣经。《深度学习》由深度学习领域三位前沿、权威的专家 Ian Goodfellow、Yoshua Bengio 和 Aaron Courville 合著,长期位居美国亚马逊人工智能类图书榜首,中文版在去年出版后更是卖到断货。


该书从浅入深介绍了基础数学知识、机器学习经验以及现阶段深度学习的理论和发展,它能帮助人工智能技术爱好者和从业人员在三位专家学者的思维带领下全方位了解深度学习。


这是一本教科书,又不只是一本教科书,任何对深度学习感兴趣的读者,阅读本书都会受益。


5、《用于数据分析的Python:Pandas,NumPy和IPython》



英文书名:Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython

作者:Wes McKinney

出版社:O'Reilly Media


本书由Python pandas项目的创建者Wes McKinney撰写,是对Python中数据科学工具的实用介绍。对于刚接触Python的分析师以及对数据科学和科学计算不熟悉的Python程序员来说,本书是理想的选择。GitHub上提供了数据文件和相关资料。


阅读本书你将学习:

  • 使用IPython shell和Jupyter notebook进行探索性计算

  • 学习NumPy中的基本功能和高级功能

  • 学习使用pandas库中的数据分析工具

  • 使用灵活的工具加载、清理、转换、合并和重塑数据

  • 使用matplotlib创建信息可视化

  • 将pandas groupby工具应用于slice,dice块和汇总数据集

  • 分析和处理规则和不规则的时间序列数据

  • 通过详细示例了解如何解决实际的数据分析问题


6、《R 数据科学》



英文名称:R for Data Science: Import, Tidy, Transform, Visualize, and Model Data 

作者:Hadley Wickham、Garrett Grolemund

出版社:O'Reilly Media


本书的目标是教会读者使用重要的数据科学工具,从而为实施数据科学奠定坚实的基础。 读完本书后,你将掌握R语言的精华,并能够熟练使用多种工具来解决各种数据科学难题。每一章都按照这样的顺序组织内容:先给出一些引人入胜的示例,以便你可以整体了解这一章的内容,然后再深入细节。本书的每一节都配有习题,以帮助你实践所学到的知识。


本书适合R数据科学家阅读。


7、《Python 数据科学手册》



英文名称:Python Data Science Handbook: Essential Tools for Working with Data

作者:Jake VanderPlas

出版社:O'Reilly Media


本书是对以数据深度需求为中心的科学、研究以及针对计算和统计方法的参考书。本书共五章,每章介绍一到两个Python数据科学中的重点工具包。首先从IPython和Jupyter开始,它们提供了数据科学家需要的计算环境;第 2章讲解能提供ndarray对象的NumPy,它可以用Python高效地存储和操作大型数组;第3章主要涉及提供DataFrame对象的Pandas,它可以用Python高效地存储和操作带标签的/列式数据;第4章的主角是Matplotlib,它为Python提供了许多数据可视化功能;第5章以Scikit-Learn为主,这个程序库为重要的机器学习算法提供了高效整洁的Python版实现。


本书适合有编程背景,并打算将开源Python工具用作分析、操作、可视化以及学习数据的数据科学研究人员。


8、《Python 机器学习》



英文名称:Python Machine Learning: Machine Learning and Deep Learning with Python, scikit-learn, and TensorFlow

作者:Sebastian Raschka、Vahid Mirjalili

出版社:Packt Publishing - ebooks Account


机器学习正在吞噬软件世界,而深度学习正在扩展机器学习。 通过第二版Sebastian Raschka的畅销书《Python机器学习》,可以了解并实现机器学习、神经网络和深度学习的最前沿的知识。 本书使用最新的Python开源库进行了彻底的更新,提供了创建机器学习,深度学习和现代数据分析所需的实用知识和技术。


从本书中,你将学到:

  • 了解数据科学、机器学习和深度学习的关键框架

  • 使用在机器学习中Python最新的开源库

  • 使用具有挑战性的真实数据探索机器学习技术

  • 使用TensorFlow库掌握深度神经网络

  • 了解分类算法的机制,以实现最佳工作

  • 使用回归分析预测连续目标结果

  • 通过聚类发现数据中的隐藏模式和结构

  • 使用情绪分析深入挖掘文本和社交媒体数据


9、《Python袖珍指南》



英文名称:Python Pocket Reference: Python In Your Pocket (Pocket Reference (O'Reilly)) 

作者:Mark Lutz

出版社:O'Reilly Media


对于的Python 3.4和2.7而言,本指南是完美的实战快速参考。你从中将会学习有关Python类型和语句、特殊方法名、内建函数与异常、常用的标准库模块及其他的Python工具。


由Mark Lutz这位公认为的Python领导者编写的《Python袖珍指南(第五版)》,是仍由Mark编写的经典Python教程(《Learning Python》和《Programming Python》,O’Reilly出版)的理想助手。


本书涵盖内容:

  • 内建对象类型,包括数字、列表、字典等更多内容

  • 创建和处理对象的语句和语法

  • 结构化和重用代码所用的函数与模块

  • Python面向对象的编程工具

  • 内建函数、异常和属性

  • 专有运算符重载方法

  • 广泛应用的标准库模块和扩展

  • 命令行选项与开发工具

  • Python的习语与提示

  • Python的SQL数据库API


10、《统计学习基础》



英文名称:The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition (Springer Series in Statistics)

作者:Trevor Hastie、 Robert Tibshirani

出版社:Springer


计算和信息技术的飞速发展带来了医学、生物学、财经和营销等诸多领域的海量数据。理解这些数据是一种挑战,这导致了统计学领域新工具的发展,并延伸到诸如数据挖掘、机器学习和生物信息学等新领域。许多工具都具有共同的基础,但常常用不同的术语来表达。《统计学习基础(第2版)(英文)》介绍了这些领域的一些重要概念。尽管应用的是统计学方法,但强调的是概念,而不是数学。许多例子附以彩图。《统计学习基础(第2版)(英文)》内容广泛,从有指导的学习(预测)到无指导的学习,应有尽有。包括神经网络、支持向量机、分类树和提升等主题,是同类书籍中介绍得*全面的。


《统计学习基础(第2版)(英文)》可作为高等院校相关专业本科生和研究生的教材,对于统计学相关人员、科学界和业界关注数据挖掘的人,《统计学习基础(第2版)(英文)》值得一读。


根据这张“迷你地图”,可以分为七个“领域”,各自都有相应的推荐书目。


新手进阶书目推荐


1、《Machine Learning For Absolute Beginners: A Plain English Introduction (Machine Learning For Beginners) 

作者:Oliver Theobald


2、《Make Your Own Neural Network: An In-depth Visual Introduction For Beginners》

作者:Michael Taylor


3、《The Math of Neural Networks》

作者:Michael Taylor


深度学习相关书目推荐


1、《Deep Learning with Python

作者:Francois Chollet


2、《Deep Learning: A Practitioner's Approach》

作者:Josh Patterson、Adam Gibson


3、《Neural Networks with R: Smart models using CNN, RNN, deep learning, and artificial intelligence principles》

作者:Giuseppe Ciaburro、Balaji Venkateswaran


数据科学相关书目推荐


1、《Data Science from Scratch: First Principles with Python

作者:Joel Grus


2、《Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking》

作者:Foster Provost、Tom Fawcett


3、《Think Bayes: Bayesian Statistics in Python 

作者:Allen B. Downey


R语言相关书目推荐


1、《ggplot2: Elegant Graphics for Data Analysis (Use R!) 

作者:Hadley Wickham


2、《R Cookbook: Proven Recipes for Data Analysis, Statistics, and Graphics (O'reilly Cookbooks)

作者:Paul Teetor


3、《R Graphics Cookbook: Practical Recipes for Visualizing Data 

作者:Winston Chang


Python相关书目推荐


1、《Introducing Python: Modern Computing in Simple Packages

作者:Bill Lubanovic


2、《Learning Python, 5th Edition

作者: Mark Lutz


3、《Fluent Python: Clear, Concise, and Effective Programming

作者:Luciano Ramalho


金融相关书目推荐


1、《Advances in Financial Machine Learning 》

作者:Marcos Lopez de Prado


2、《Building Winning Algorithmic Trading Systems, + Website: A Trader's Journey From Data Mining to Monte Carlo Simulation to Live Trading (Wiley Trading) 》

作者:Kevin J. Davey


3、《Algorithmic Trading: Winning Strategies and Their Rationale》

作者:Ernie Chan


专家级书目推荐


1、《Pattern Recognition and Machine Learning (Information Science and Statistics)

作者:Christopher M. Bishop


2、《Machine Learning (McGraw-Hill International Editions Computer Science Series) 

作者:Tom M. Mitchell


3、《Reinforcement Learning: An Introduction (Adaptive Computation and Machine Learning) 

作者:Richard S. Sutton、Andrew G. Barto


更多相关书目推荐,请查阅原文链接:

https://anvaka.github.io/greview/hands-on-ml/1/



新智元AI WORLD 2018大会【早鸟票】

开售!


新智元将于9月20日在北京国家会议中心举办AI WORLD 2018 大会,邀请计算机视觉先驱Alan Yullie,机器学习教父、CMU教授 Tom Mitchell,迈克思·泰格马克,周志华,陶大程,陈怡然等AI领袖一起关注机器智能与人类命运。


大会官网:

http://www.aiworld2018.com/ 


即日起到8月19日,新智元限量发售若干早鸟票,与全球AI领袖近距离交流,见证全球人工智能产业跨越发展。



  • 活动行购票链接:

    http://www.huodongxing.com/event/6449053775000

  • 活动行购票二维码: 

登录查看更多
5

相关内容

Scikit-learn项目最早由数据科学家David Cournapeau 在2007 年发起,需要NumPy和SciPy等其他包的支持,是Python语言中专门针对机器学习应用而发展起来的一款开源框架。

这本书来自统计学习课程,这是一门统计机器学习的入门课程,面向具有一些微积分、线性代数和统计学背景的学生。这门课程的重点是监督学习:分类和回归。本课程将涵盖机器学习和数据科学中使用的一系列方法,包括:

  • 线性回归(包括岭回归和Lasso)
  • 通过logistic回归和k近邻进行分类
  • 线性和二次判别分析
  • 回归和分类树(包括套袋林和随机林)
  • Boosting
  • 神经网络和深度学习

这些方法将在整个课程中被研究并应用于来自各种应用的真实数据。课程还涵盖了一些重要的实际问题,如交叉验证、模型选择和偏方差权衡。课程包括理论(例如,推导和证明)以及实践(特别是实验室和小型项目)。实际部分将使用Python实现。

成为VIP会员查看完整内容
0
77
小贴士
相关资讯
从入门到头秃,2018年机器学习图书TOP10
新智元
11+阅读 · 2018年12月8日
送书预告|听说读一本好书和假期更配哦
论智
6+阅读 · 2018年3月31日
书单 | 深度学习修炼秘籍
机器学习算法与Python学习
9+阅读 · 2018年3月27日
推荐|给你12本热门的深度学习书籍
全球人工智能
11+阅读 · 2018年3月18日
2018年最佳深度学习书单(从零到深度学习工程师)
七月在线实验室
6+阅读 · 2018年3月16日
【每周一本书】之《深度学习入门与实践》
数据猿
5+阅读 · 2018年1月9日
相关论文
Talking-Heads Attention
Noam Shazeer,Zhenzhong Lan,Youlong Cheng,Nan Ding,Le Hou
11+阅读 · 2020年3月5日
Adaptive Neural Trees
Ryutaro Tanno,Kai Arulkumaran,Daniel C. Alexander,Antonio Criminisi,Aditya Nori
3+阅读 · 2018年12月10日
Baohua Sun,Lin Yang,Patrick Dong,Wenhan Zhang,Jason Dong,Charles Young
4+阅读 · 2018年10月15日
Structural Consistency and Controllability for Diverse Colorization
Safa Messaoud,David Forsyth,Alexander G. Schwing
7+阅读 · 2018年9月6日
Dinghan Shen,Martin Renqiang Min,Yitong Li,Lawrence Carin
5+阅读 · 2018年8月30日
Stéphane Lathuilière,Benoit Massé,Pablo Mesejo,Radu Horaud
6+阅读 · 2018年4月23日
Jiayuan Gu,Han Hu,Liwei Wang,Yichen Wei,Jifeng Dai
4+阅读 · 2018年3月19日
Parisa Naderi Golshan,HosseinAli Rahmani Dashti,Shahrzad Azizi,Leila Safari
6+阅读 · 2018年3月15日
Minghui Liao,Zhen Zhu,Baoguang Shi,Gui-song Xia,Xiang Bai
12+阅读 · 2018年3月14日
Quanshi Zhang,Ying Nian Wu,Song-Chun Zhu
14+阅读 · 2018年2月14日
Top