https://inferentialthinking.com/chapters/intro.html

数据科学是通过探索、预测和推理,从庞大而多样的数据集中得出有用的结论。探索包括识别信息中的模式。预测是指利用我们已知的信息,对我们希望知道的值做出有根据的猜测。推论包括量化我们的确定性程度:我们发现的那些模式是否也会出现在新的观察中?我们的预测有多准确?我们用于探索的主要工具是可视化和描述性统计,用于预测的是机器学习和优化,用于推断的是统计测试和模型。统计学是数据科学的核心组成部分,因为统计学研究如何在不完整的信息下得出可靠的结论。计算是一个核心组件,因为编程允许我们将分析技术应用于现实世界中出现的大量和多样化的数据集:不仅是数字,还有文本、图像、视频和传感器读数。数据科学包含了所有这些东西,但由于应用,它不仅仅是各部分的总和。通过理解一个特定的领域,数据科学家学会对他们的数据提出适当的问题,并正确解释我们的推理和计算工具提供的答案。

通过本书一步一步地,您将学习如何利用算法思维和代码的力量,获得关于当前机器学习方法的力量和局限性的直觉,并有效地将它们应用到实际的业务问题。

成为VIP会员查看完整内容
71

相关内容

专知会员服务
113+阅读 · 2021年10月17日
专知会员服务
76+阅读 · 2021年10月12日
专知会员服务
236+阅读 · 2021年10月8日
专知会员服务
59+阅读 · 2021年9月18日
【经典书】半监督学习,524页pdf
专知会员服务
134+阅读 · 2021年8月20日
【经典书】机器学习统计学,476页pdf
专知会员服务
118+阅读 · 2021年7月19日
【经典书】机器学习导论,234页pdf
专知会员服务
73+阅读 · 2021年4月20日
【经典书】信息论原理,774页pdf
专知会员服务
239+阅读 · 2021年3月22日
【干货书】计算机科学离散数学,627页pdf
专知
53+阅读 · 2020年8月31日
421页《机器学习数学基础》最新2019版PDF下载
CCCF译文 | 机器学习如何影响本科生计算机课程
中国计算机学会
6+阅读 · 2019年2月18日
免费教材-《数据科学基础-2018》最新版下载
深度学习与NLP
36+阅读 · 2018年12月28日
七本书籍带你打下机器学习和数据科学的数学基础
Arxiv
28+阅读 · 2021年10月1日
Bayesian Attention Belief Networks
Arxiv
9+阅读 · 2021年6月9日
A Probe into Understanding GAN and VAE models
Arxiv
9+阅读 · 2018年12月13日
Neural Architecture Optimization
Arxiv
8+阅读 · 2018年9月5日
Text classification using capsules
Arxiv
5+阅读 · 2018年8月12日
Arxiv
5+阅读 · 2018年6月5日
Arxiv
151+阅读 · 2017年8月1日
VIP会员
相关主题
相关VIP内容
专知会员服务
113+阅读 · 2021年10月17日
专知会员服务
76+阅读 · 2021年10月12日
专知会员服务
236+阅读 · 2021年10月8日
专知会员服务
59+阅读 · 2021年9月18日
【经典书】半监督学习,524页pdf
专知会员服务
134+阅读 · 2021年8月20日
【经典书】机器学习统计学,476页pdf
专知会员服务
118+阅读 · 2021年7月19日
【经典书】机器学习导论,234页pdf
专知会员服务
73+阅读 · 2021年4月20日
【经典书】信息论原理,774页pdf
专知会员服务
239+阅读 · 2021年3月22日
相关论文
Arxiv
28+阅读 · 2021年10月1日
Bayesian Attention Belief Networks
Arxiv
9+阅读 · 2021年6月9日
A Probe into Understanding GAN and VAE models
Arxiv
9+阅读 · 2018年12月13日
Neural Architecture Optimization
Arxiv
8+阅读 · 2018年9月5日
Text classification using capsules
Arxiv
5+阅读 · 2018年8月12日
Arxiv
5+阅读 · 2018年6月5日
Arxiv
151+阅读 · 2017年8月1日
微信扫码咨询专知VIP会员