《数据科学设计手册》提供了实用的见解,突出了分析数据中真正重要的东西,并提供了如何使用这些核心概念的直观理解。这本书没有强调任何特定的编程语言或数据分析工具套件,而是专注于重要设计原则的高级讨论。这个易于阅读的文本理想地服务于本科生和早期研究生的需要,开始“数据科学入门”课程。它揭示了这门学科是如何以其独特的分量和特点,处于统计学、计算机科学和机器学习的交叉领域。在这些和相关领域的从业者会发现这本书完美的自学以及。

《数据科学设计手册》是数据科学的介绍,重点介绍建立收集、分析和解释数据的系统所需的技能和原则。作为一门学科,数据科学位于统计学、计算机科学和机器学习的交汇处,但它正在构建自己独特的分量和特征。

这本书涵盖了足够的材料在本科或早期研究生水平的“数据科学入门”课程。在这里可以找到教学这门课程的全套讲课幻灯片,以及项目和作业的数据资源,以及在线视频讲座。

成为VIP会员查看完整内容
0
49

相关内容

需要处理大量数据的人必备的案头书

对于许多研究人员来说,Python是首选的工具,因为它拥有丰富的储存、操作、以及洞察数据的程式库。这些资源散布在数据科学的领域中,但藉由本书,你可以一口气取得这些资源,包括Ipython、NumPy、Pandas、Matplotlib、Scikit-Learn等等。

对于需要处理大量数据的人而言,这是一本非常有价值的案头书,可以有效率地处理每天面对的问题,像是操作、转换,以及清理数据、视觉化不同形式的数据,建立统计学或机器学习的模型等等。

藉由这本手册,你将可以学习到如何使用: IPython和Jupyter:提供数据科学家使用的Python计算环境。 NumPy:在Python中进行高效储存以及操作密集数据阵列的ndarrys。 Pandas:在Python中进行对于标签式/栏位式的数据高效率储存与操作。 Matplotlib:在Python中进行弹性范围的数据视觉化的能力。 Scikit-Learn:提供机器学习演算法以及简洁的Python实作。

成为VIP会员查看完整内容
0
53

学习使用Python分析数据和预测结果的更简单和更有效的方法

Python机器学习教程展示了通过关注两个核心机器学习算法家族来成功分析数据,本书能够提供工作机制的完整描述,以及使用特定的、可破解的代码来说明机制的示例。算法用简单的术语解释,没有复杂的数学,并使用Python应用,指导算法选择,数据准备,并在实践中使用训练过的模型。您将学习一套核心的Python编程技术,各种构建预测模型的方法,以及如何测量每个模型的性能,以确保使用正确的模型。关于线性回归和集成方法的章节深入研究了每种算法,你可以使用书中的示例代码来开发你自己的数据分析解决方案。

机器学习算法是数据分析和可视化的核心。在过去,这些方法需要深厚的数学和统计学背景,通常需要结合专门的R编程语言。这本书演示了机器学习可以如何实现使用更广泛的使用和可访问的Python编程语言。

使用线性和集成算法族预测结果

建立可以解决一系列简单和复杂问题的预测模型

使用Python应用核心机器学习算法

直接使用示例代码构建自定义解决方案

机器学习不需要复杂和高度专业化。Python使用了更简单、有效和经过良好测试的方法,使这项技术更容易为更广泛的受众所接受。Python中的机器学习将向您展示如何做到这一点,而不需要广泛的数学或统计背景。

成为VIP会员查看完整内容
0
131

本书解释了数据科学中至关重要的统计学概念,介绍如何将各种统计方法应用于数据科学。作者以易于理解、浏览和参考的方式,引出统计学中与数据科学相关的关键概念;解释各统计学概念在数据科学中的重要性及有用程度,并给出原因。

统计方法是数据科学的关键部分,但很少有数据科学家有任何正式的统计培训。关于基本统计的课程和书籍很少从数据科学的角度涵盖这个主题。这本实用指南解释了如何将各种统计方法应用到数据科学中,告诉你如何避免它们被误用,并就什么是重要的、什么是不重要的给出建议。

许多数据科学资源包含了统计方法,但缺乏更深层次的统计视角。如果您熟悉R编程语言,并且对统计学有一定的了解,那么本文的快速引用将以一种可访问、可读的格式填补空白。

通过这本书,你会学到:

  • 为什么探索性数据分析是数据科学的一个关键的初步步骤
  • 随机抽样如何在大数据的情况下减少偏差并产生更高质量的数据集
  • 实验设计的原则如何为问题提供明确的答案
  • 如何使用回归估计结果和检测异常
  • 用于预测记录所属类别的关键分类技术
  • 从数据中“学习”的统计机器学习方法
  • 从无标记数据中提取意义的无监督学习方法

https://www.oreilly.com/library/view/practical-statistics-for/9781491952955/

成为VIP会员查看完整内容
0
51

概率论起源于17世纪的法国,当时两位伟大的法国数学家,布莱斯·帕斯卡和皮埃尔·德·费马,对两个来自机会博弈的问题进行了通信。帕斯卡和费马解决的问题继续影响着惠更斯、伯努利和DeMoivre等早期研究者建立数学概率论。今天,概率论是一个建立良好的数学分支,应用于从音乐到物理的学术活动的每一个领域,也应用于日常经验,从天气预报到预测新的医疗方法的风险。

本文是为数学、物理和社会科学、工程和计算机科学的二、三、四年级学生开设的概率论入门课程而设计的。它提出了一个彻底的处理概率的想法和技术为一个牢固的理解的主题必要。文本可以用于各种课程长度、水平和重点领域。

在标准的一学期课程中,离散概率和连续概率都包括在内,学生必须先修两个学期的微积分,包括多重积分的介绍。第11章包含了关于马尔可夫链的材料,为了涵盖这一章,一些矩阵理论的知识是必要的。

文本也可以用于离散概率课程。材料被组织在这样一种方式,离散和连续的概率讨论是在一个独立的,但平行的方式,呈现。这种组织驱散了对概率过于严格或正式的观点,并提供了一些强大的教学价值,因为离散的讨论有时可以激发更抽象的连续的概率讨论。在离散概率课程中,学生应该先修一学期的微积分。

为了充分利用文中的计算材料和例子,假设或必要的计算背景很少。所有在文本中使用的程序都是用TrueBASIC、Maple和Mathematica语言编写的。

成为VIP会员查看完整内容
0
67

越来越多来自不同领域的计算机科学家使用离散数学结构来解释概念和问题。在教学经验的基础上,作者提供了一个容易理解的文本,强调了离散数学的基础及其高级课题。这篇文章展示了如何用清晰的数学语言表达精确的思想。学生发现离散数学在描述计算机科学结构和解决问题方面的重要性。他们还学习如何掌握离散数学将帮助他们发展重要的推理技能,这些技能将在他们的职业生涯中继续发挥作用。

成为VIP会员查看完整内容
0
78

如果您是用Python编程的新手,并且正在寻找可靠的介绍,那么这本书就是为您准备的。由计算机科学教师开发,在“为绝对初学者”系列丛书通过简单的游戏创造教授编程的原则。您将获得实际的Python编程应用程序所需的技能,并将了解如何在真实场景中使用这些技能。在整个章节中,你会发现一些代码示例来说明所提出的概念。在每一章的结尾,你会发现一个完整的游戏,展示了这一章的关键思想,一章的总结,以及一系列的挑战来测试你的新知识。当你读完这本书的时候,你将非常精通Python,并且能够将你所学到的基本编程原理应用到你要处理的下一种编程语言。

成为VIP会员查看完整内容
0
125

管理统计和数据科学的原理包括:数据可视化;描述性措施;概率;概率分布;数学期望;置信区间;和假设检验。方差分析;简单线性回归;多元线性回归也包括在内。另外,本书还提供了列联表、卡方检验、非参数方法和时间序列方法。

教材:

  • 包括通常在入门统计学课程中涵盖的学术材料,但与数据科学扭曲,较少强调理论
  • 依靠Minitab来展示如何用计算机执行任务
  • 展示并促进来自开放门户的数据的使用
  • 重点是发展对程序如何工作的直觉
  • 让读者了解大数据的潜力和目前使用它的失败之处
成为VIP会员查看完整内容
1
107

数据科学库、框架、模块和工具包非常适合进行数据科学研究,但它们也是深入研究这一学科的好方法,不需要真正理解数据科学。在本书中,您将了解到许多最基本的数据科学工具和算法都是通过从头实现来实现的。

如果你有数学天赋和一些编程技能,作者Joel Grus将帮助你熟悉作为数据科学核心的数学和统计,以及作为数据科学家的入门技能。如今,这些杂乱的、充斥着海量数据的数据,为一些甚至没人想过要问的问题提供了答案。这本书为你提供了挖掘这些答案的诀窍。

参加Python速成班

  • 学习线性代数、统计和概率的基础知识,并了解如何以及何时在数据科学中使用它们
  • 收集、探索、清理、分析和操作数据
  • 深入了解机器学习的基本原理
  • 实现诸如k近邻、朴素贝叶斯、线性和逻辑回归、决策树、神经网络和聚类等模型
  • 探索推荐系统、自然语言处理、网络分析、MapReduce和数据库
成为VIP会员查看完整内容
0
87

通过机器学习的实际操作指南深入挖掘数据

机器学习: 为开发人员和技术专业人员提供实践指导和全编码的工作示例,用于开发人员和技术专业人员使用的最常见的机器学习技术。这本书包含了每一个ML变体的详细分析,解释了它是如何工作的,以及如何在特定的行业中使用它,允许读者在阅读过程中将所介绍的技术融入到他们自己的工作中。机器学习的一个核心内容是对数据准备的强烈关注,对各种类型的学习算法的全面探索说明了适当的工具如何能够帮助任何开发人员从现有数据中提取信息和见解。这本书包括一个完整的补充教师的材料,以方便在课堂上使用,使这一资源有用的学生和作为一个专业的参考。

机器学习的核心是一种基于数学和算法的技术,它是历史数据挖掘和现代大数据科学的基础。对大数据的科学分析需要机器学习的工作知识,它根据从训练数据中获得的已知属性形成预测。机器学习是一个容易理解的,全面的指导,为非数学家,提供明确的指导,让读者:

  • 学习机器学习的语言,包括Hadoop、Mahout和Weka
  • 了解决策树、贝叶斯网络和人工神经网络
  • 实现关联规则、实时和批量学习
  • 为安全、有效和高效的机器学习制定战略计划

通过学习构建一个可以从数据中学习的系统,读者可以在各个行业中增加他们的效用。机器学习是深度数据分析和可视化的核心,随着企业发现隐藏在现有数据中的金矿,这一领域的需求越来越大。对于涉及数据科学的技术专业人员,机器学习:为开发人员和技术专业人员提供深入挖掘所需的技能和技术。

成为VIP会员查看完整内容
0
113
小贴士
相关主题
相关VIP内容
专知会员服务
53+阅读 · 3月14日
专知会员服务
131+阅读 · 2月25日
专知会员服务
51+阅读 · 2020年12月31日
专知会员服务
67+阅读 · 2020年11月25日
专知会员服务
78+阅读 · 2020年8月31日
专知会员服务
125+阅读 · 2020年8月14日
专知会员服务
107+阅读 · 2020年7月29日
专知会员服务
87+阅读 · 2020年5月19日
【新书】Python编程基础,669页pdf
专知会员服务
105+阅读 · 2019年10月10日
相关论文
Colin White,Sam Nolen,Yash Savani
0+阅读 · 6月16日
Julius Berner,Philipp Grohs,Gitta Kutyniok,Philipp Petersen
32+阅读 · 5月9日
Wei Chen,Yu Liu,Weiping Wang,Erwin Bakker,Theodoros Georgiou,Paul Fieguth,Li Liu,Michael S. Lew
12+阅读 · 1月27日
Beyond Lexical: A Semantic Retrieval Framework for Textual SearchEngine
Kuan Fang,Long Zhao,Zhan Shen,RuiXing Wang,RiKang Zhour,LiWen Fan
10+阅读 · 2020年8月10日
VrR-VG: Refocusing Visually-Relevant Relationships
Yuanzhi Liang,Yalong Bai,Wei Zhang,Xueming Qian,Li Zhu,Tao Mei
6+阅读 · 2019年8月26日
Rem Hida,Naoya Takeishi,Takehisa Yairi,Koichi Hori
7+阅读 · 2018年5月6日
Yan Zhang,Jonathon Hare,Adam Prügel-Bennett
10+阅读 · 2018年2月15日
Wei He,Kai Liu,Yajuan Lyu,Shiqi Zhao,Xinyan Xiao,Yuan Liu,Yizhong Wang,Hua Wu,Qiaoqiao She,Xuan Liu,Tian Wu,Haifeng Wang
3+阅读 · 2017年11月15日
Top