【干货书】Python数据科学入门,464页pdf

2020 年 9 月 20 日 专知

本书基于易于理解且具有数据科学相关的丰富的库的Python语言环境,从零开始讲解数据科学工作。具体内容包括:Python速成,可视化数据,线性代数,统计,概率,假设与推断,梯度下降法,如何获取数据,k近邻法,朴素贝叶斯算法,等等。作者借助大量具体例子以及数据挖掘、统计学、机器学习等领域的重要概念,详细展示了什么是数据科学。


* 简单介绍Python
* 回顾一下线性几何、统计和概率知识,了解搞数据科学的时候怎么使用它们
* 收集、探索、清理、转换和操作数据
* 了解机器学习的基本知识
* 实现K近邻、朴素贝叶斯、线性及逻辑回归、决策树、神经网络及聚类等模型
* 探索推荐系统、自然语言处理、网络分析、MapReduce,还有数据库


https://www.oreilly.com/library/view/data-science-from/9781491901410/



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“P464” 可以获取《【干货书】Python数据科学入门,464页pdf》专知下载链接索引



有人称数据科学家为“21 世纪头号性感职业”(https://hbr.org/2012/10/data-scientist-thesexiest-job-of-the-21st-century/)。虽说如此称呼有些夸张,但这个名称对数据科学的推崇却 一点也没错,这是一个蓬勃发展、前途无限的行业。很多分析师都预言,未来十年会需要 比现在多得多的数据科学工作者。


那么,什么是数据科学?唯有正确理解数据科学,才能培养出数据科学家。根据广受业界 赞誉的文氏图(http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram),数据科 学是以下几个方面的交叉:

• 黑客技能

• 数学和统计学知识 

• 专业技能 


我原本很想写一本能涵盖以上三个方面的书,但很快意识到仅关于专业技能的撰写就会耗费 上万页笔墨,于是及时放弃转而专注于前两个方面。我的目标有两个:一是帮助读者掌握从 事数据科学工作所必需的黑客技能;二是帮助读者熟悉数学和统计学,这是数据科学的核心。 


对一本书来说,这两个愿望有点大了。学习黑客技能的最好方法就是钻研技术。通过阅读 本书,你可以理解我钻研技术的方式,但相同的方式对你未必最适合;你可以理解我使用 的一些工具,但相同的工具对你来说未必最顺手;你可以理解我如何解决数据问题,但相 同的方式对你来说未必最有效。举例的目的和希望是启发你以自己的方式和方法完成工 作。本书涵盖的所有代码和数据都可以从 GitHub 上下载。 


同样,学习数学的最好方式就是研习数学。当然本书并不是一部数学著作,我们在本书中 大半也不会“研习数学”,我想强调的是数学知识对从事数据科学工作至关重要。不理解  前言 概率、统计、线性代数,就无法真正开始数据科学工作。在需要的地方,书中会引入数学 方程式、数学直觉、数学公理,以及借以阐释大数学思想的卡通漫画。有我在,别怕! 


总之,数据科学相当有趣(尤其和税务筹划或者煤矿开采等其他工作相比)。



专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

数据科学(英語:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。 它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。 数据科学通过运用各种相关的数据来帮助非专业人士理解问题。
【最受欢迎的概率书】《概率论:理论与实例》,490页pdf
专知会员服务
159+阅读 · 2020年11月13日
【干货书】Python数据科学分析,413页pdf
专知会员服务
87+阅读 · 2020年8月22日
【干货书】Python 编程,480页pdf
专知会员服务
228+阅读 · 2020年8月14日
【干货书】管理统计和数据科学原理,678页pdf
专知会员服务
176+阅读 · 2020年7月29日
【干货书】现代数据平台架构,636页pdf
专知会员服务
250+阅读 · 2020年6月15日
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
256+阅读 · 2020年6月10日
专知会员服务
165+阅读 · 2020年6月4日
【实用书】Python数据科学从零开始,330页pdf
专知会员服务
139+阅读 · 2020年5月19日
机器学习速查手册,135页pdf
专知会员服务
336+阅读 · 2020年3月15日
【干货书】计算机科学离散数学,627页pdf
专知
54+阅读 · 2020年8月31日
五个给机器学习和数据科学入门者的学习建议
机器之心
3+阅读 · 2019年9月16日
421页《机器学习数学基础》最新2019版PDF下载
下载 | 100页机器学习入门完整版,初学者必备!
机器学习算法与Python学习
15+阅读 · 2018年12月18日
入门 | 一文介绍机器学习中基本的数学符号
机器之心
28+阅读 · 2018年4月9日
荐书丨Python数据分析从入门到精通
程序人生
18+阅读 · 2018年3月31日
Python数据科学超强阵容书单
图灵教育
6+阅读 · 2018年3月26日
干货|7步让你从零开始掌握Python机器学习!
全球人工智能
8+阅读 · 2017年9月24日
Arxiv
0+阅读 · 2020年12月2日
Arxiv
0+阅读 · 2020年12月2日
Arxiv
0+阅读 · 2020年11月27日
A Survey of Deep Learning for Scientific Discovery
Arxiv
29+阅读 · 2020年3月26日
Arxiv
4+阅读 · 2018年5月24日
Arxiv
7+阅读 · 2018年1月30日
VIP会员
相关VIP内容
【最受欢迎的概率书】《概率论:理论与实例》,490页pdf
专知会员服务
159+阅读 · 2020年11月13日
【干货书】Python数据科学分析,413页pdf
专知会员服务
87+阅读 · 2020年8月22日
【干货书】Python 编程,480页pdf
专知会员服务
228+阅读 · 2020年8月14日
【干货书】管理统计和数据科学原理,678页pdf
专知会员服务
176+阅读 · 2020年7月29日
【干货书】现代数据平台架构,636页pdf
专知会员服务
250+阅读 · 2020年6月15日
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
256+阅读 · 2020年6月10日
专知会员服务
165+阅读 · 2020年6月4日
【实用书】Python数据科学从零开始,330页pdf
专知会员服务
139+阅读 · 2020年5月19日
机器学习速查手册,135页pdf
专知会员服务
336+阅读 · 2020年3月15日
相关资讯
【干货书】计算机科学离散数学,627页pdf
专知
54+阅读 · 2020年8月31日
五个给机器学习和数据科学入门者的学习建议
机器之心
3+阅读 · 2019年9月16日
421页《机器学习数学基础》最新2019版PDF下载
下载 | 100页机器学习入门完整版,初学者必备!
机器学习算法与Python学习
15+阅读 · 2018年12月18日
入门 | 一文介绍机器学习中基本的数学符号
机器之心
28+阅读 · 2018年4月9日
荐书丨Python数据分析从入门到精通
程序人生
18+阅读 · 2018年3月31日
Python数据科学超强阵容书单
图灵教育
6+阅读 · 2018年3月26日
干货|7步让你从零开始掌握Python机器学习!
全球人工智能
8+阅读 · 2017年9月24日
Top
微信扫码咨询专知VIP会员