统计学正迅速成为数学中最重要的多学科领域。据美国统计协会称,统计学是增长最快的10个职业之一,而统计学是增长最快的学士学位之一。统计素养对我们这个数据驱动的社会至关重要。尽管对统计能力的重要性和需求增加,但统计方面的教学方法几乎没有改变。使用Mike Bostock的数据可视化软件,D3.js,看到理论可视化的基本概念所涵盖的大学统计学导论或大学预修课程的统计。我们鼓励学生将视觉理论作为教科书、教授和同学的额外资源。

来自斯坦福大学的一位研究生和他的伙伴们开发了一本颇有新意的统计概率入门教材,与传统教材不同的是,这本书充分利用了数据可视化技术,交互性和趣味性都非常强,可以边读边玩。

该书共分为 6 章,分别为基础概率论、进阶概率论、概率分布、统计推断:频率学派、统计推断:贝叶斯学派和回归分析,每章分为三个小节,如图所示:

成为VIP会员查看完整内容
0
37

相关内容

这本书的目的是介绍图理论的基础。在第一章中,我们对数学符号和证明技巧给予了明确的关注。这种方法使学生逐渐为使用图论所必需的工具——复杂网络——做好准备。在书的第二部分,学生学习关于随机网络,小世界,互联网和网络的结构,点对点系统,和社会网络。再说一次,所有的问题都是在初级阶段讨论的,但这样到最后学生们确实会有这样的感觉:1。学会了如何阅读和理解与图论相关的基本数学。了解基本图论如何应用于优化问题,如通讯网络中的路由。更多地了解这个小世界和随机网络的神秘领域。

成为VIP会员查看完整内容
0
61

这本书的书名听起来有点神秘。如果这本书以一种错误的方式呈现了这个主题,人们为什么要读它呢?书中哪些地方做得特别“不对”?

在回答这些问题之前,让我先描述一下本文的目标受众。这本书是“荣誉线性代数”课程的课堂讲稿。这应该是高等数学学生的第一门线性代数课程。它的目标是一个学生,虽然还不是非常熟悉抽象推理,但愿意学习更严格的数学,在“烹饪书风格”的微积分类型课程。除了作为线性代数的第一门课程,它也应该是第一门向学生介绍严格证明、形式定义——简而言之,现代理论(抽象)数学风格的课程。

目标读者解释了基本概念和具体实例的非常具体的混合,它们通常出现在介绍性的线性代数文本中,具有更抽象的定义和高级书籍的典型构造。

https://www.math.brown.edu/streil/papers/LADW/LADW_2017-09-04.pdf

成为VIP会员查看完整内容
0
65

这本书系统性讲述了统计学理论,包括概率理论、分布式理论与统计模型,基本统计理论、贝叶斯理论、无偏点估计、最大似然统计推断、统计假设与置信集、非参与鲁棒推断。

第一门课程以对统计中有用的测量论概率论的概念和结果的简要概述开始。随后讨论了统计决策理论和推理中的一些基本概念。探讨了估计的基本方法和原理,包括各种限制条件下的最小风险方法,如无偏性或等方差法,最大似然法,以及矩法和其他插件方法等函数法。然后详细地考虑了贝叶斯决策规则。详细介绍了最小方差无偏估计的方法。主题包括统计量的充分性和完全性、 Fisher信息、估计量的方差的界、渐近性质和统计决策理论,包括极大极小和贝叶斯决策规则。

第二门课程更详细地介绍了假设检验和置信集的原理。我们考虑了决策过程的表征,内曼-皮尔森引理和一致最有力的测试,置信集和推理过程的无偏性。其他主题包括等方差、健壮性和函数估计。

除了数理统计的经典结果外,还讨论了马尔可夫链蒙特卡洛理论、拟似然、经验似然、统计泛函、广义估计方程、折刀法和自举法。

http://mason.gmu.edu/~jgentle/books/MathStat.pdf

成为VIP会员查看完整内容
0
69

这是我2004年,2006年和2009年在斯坦福大学教授的概率理论博士课程的讲义。本课程的目标是为斯坦福大学数学和统计学系的博士生做概率论研究做准备。更广泛地说,文本的目标是帮助读者掌握概率论的数学基础和在这一领域中证明定理最常用的技术。然后将此应用于随机过程的最基本类的严格研究。

为此,我们在第一章中介绍了测度与积分理论中的相关元素,即事件的概率空间与格-代数、作为可测函数的随机变量、它们的期望作为相应的勒贝格积分,以及独立性的重要概念。

利用这些元素,我们在第二章中研究了随机变量收敛的各种概念,并推导了大数的弱定律和强定律。

第三章讨论了弱收敛的理论、分布函数和特征函数的相关概念以及中心极限定理和泊松近似的两个重要特例。

基于第一章的框架,我们在第四章讨论了条件期望的定义、存在性和性质,以及相关的规则条件概率分布。

第五章讨论了过滤、信息在时间上的级数的数学概念以及相应的停止时间。关于后者的结果是作为一组称为鞅的随机过程研究的副产品得到的。讨论了鞅表示、极大不等式、收敛定理及其各种应用。为了更清晰和更容易的表述,我们在这里集中讨论离散时间的设置来推迟与第九章相对应的连续时间。

第六章简要介绍了马尔可夫链的理论,概率论的核心是一个庞大的主题,许多教科书都致力于此。我们通过研究一些有趣的特殊情况来说明这类过程的一些有趣的数学性质。

在第七章中,我们简要介绍遍历理论,将注意力限制在离散时间随机过程的应用上。我们定义了平稳过程和遍历过程的概念,推导了Birkhoff和Kingman的经典定理,并强调了该理论的许多有用应用中的少数几个。

第八章建立了以连续时间参数为指标的右连续随机过程的研究框架,引入了高斯过程族,并严格构造了布朗运动为连续样本路径和零均值平稳独立增量的高斯过程。

第九章将我们先前对鞅和强马尔可夫过程的处理扩展到连续时间的设定,强调了右连续滤波的作用。然后在布朗运动和马尔可夫跳跃过程的背景下说明了这类过程的数学结构。

在此基础上,在第十章中,我们利用不变性原理重新构造了布朗运动作为某些重新标定的随机游动的极限。进一步研究了其样本路径的丰富性质以及布朗运动在clt和迭代对数定律(简称lil)中的许多应用。

https://statweb.stanford.edu/~adembo/stat-310b/lnotes.pdf

成为VIP会员查看完整内容
0
77

本书围绕虚拟化、并发和持久性这三个主要概念展开,介绍了所有现代系统的主要组件(包括调度、虚拟内存管理、磁盘和I/O子系统、文件系统)。全书共50章,分为3个部分,分别讲述虚拟化、并发和持久性的相关内容。作者以对话形式引入所介绍的主题概念,行文诙谐幽默却又鞭辟入里,力求帮助读者理解操作系统中虚拟化、并发和持久性的原理。本书内容全面,并给出了真实可运行的代码(而非伪代码),还提供了相应的练习,很适合高等院校相关专业的教师开展教学和高校学生进行自学。​

本书具有以下特色:

  • 主题突出,紧紧围绕操作系统的三大主题元素——虚拟化、并发和持久性。
  • 以对话的方式引入背景,提出问题,进而阐释原理,启发动手实践。
  • 包含众多“补充”和“提示”,拓展读者知识面,增加趣味性。
  • 使用真实代码而不是伪代码,让读者更加深入透彻地了解操作系统。
  • 提供作业、模拟和项目等众多学习方式,鼓励读者动手实践。
  • 为教师提供教学辅助资源。

成为VIP会员查看完整内容
0
96

本书基于易于理解且具有数据科学相关的丰富的库的Python语言环境,从零开始讲解数据科学工作。具体内容包括:Python速成,可视化数据,线性代数,统计,概率,假设与推断,梯度下降法,如何获取数据,k近邻法,朴素贝叶斯算法,等等。作者借助大量具体例子以及数据挖掘、统计学、机器学习等领域的重要概念,详细展示了什么是数据科学。

介绍数据科学基本知识的重量级读本,Google数据科学家作品。

数据科学是一个蓬勃发展、前途无限的行业,有人将数据科学家称为“21世纪头号性感职业”。本书从零开始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识——数学和统计学。

作者选择了功能强大、简单易学的Python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好、简洁易读的实现范例。书中涵盖的所有代码和数据都可以在GitHub上下载。

  • 简单介绍Python
  • 回顾一下线性几何、统计和概率知识,了解搞数据科学的时候怎么使用它们
  • 收集、探索、清理、转换和操作数据
  • 了解机器学习的基本知识
  • 实现K近邻、朴素贝叶斯、线性及逻辑回归、决策树、神经网络及聚类等模型
  • 探索推荐系统、自然语言处理、网络分析、MapReduce,还有数据库
成为VIP会员查看完整内容
0
47

统计学习是一套以复杂数据建模和数据理解为目的的工具集,是近期才发展起来的统计学的一个新领域。本书出自统计学习领域声名显赫的几位专家,结合R语言介绍了分析大数据必不可少的工具,提供一些重要的建模和预测技术,并借助丰富的实验来解释如何用R语言实现统计学习方法。论题包括线性回归、分类、重抽样方法、压缩方法、基于树的方法、支持向量机、聚类等,作者借助彩图和实际案例直观解释这些方法。为了读者更好地理解书中内容,每章后还配有丰富的概念性和应用性练习题。

  书中内容与《The Elements of Statistical Learning》的大部分内容相同,但是本书起点低,弱化了数学推导的细节,更注重方法的应用,所以更适合作为入门教材。当然,这本《统计学习导论》不仅是优秀的“统计学习”或“机器学习”课程的教材,也是数据挖掘、数据分析等相关从业者不可或缺的参考书。

Gareth James 斯坦福大学统计学博士毕业,师从Trevor Hastie。现为南加州大学马歇尔商学院统计学教授,美国统计学会会士,数理统计协会终身会员,新西兰统计协会会员。《Statistica Sinica》、《Applications and Case Studies》、《Theory and Methods》等期刊的副主编。

  Daniela Witten 斯坦福大学统计学博士毕业,师从Robert Tibshirani。现为华盛顿大学生物统计学副教授,美国统计学会和国际数理统计协会会士,《Journal of Computational and Graphical Statistics》和《Biometrika》等期刊副主编。

  Trevor Hastie 美国统计学家和计算机科学家,斯坦福大学统计学教授,英国皇家统计学会、国际数理统计协会和美国统计学会会士。Hastie参与开发了 R 中的大部分统计建模软件和环境,发明了主曲线和主曲面。

  Robert Tibshirani 斯坦福大学统计学教授,国际数理统计协会、美国统计学会和加拿大皇家学会会士,1996年COPSS总统奖得主,提出lasso方法。Hastie和Tibshirani都是统计学习领域的泰山北斗,两人合著《The Elements of Statistical Learning》,还合作讲授斯坦福大学的公开课《统计学习》。  

成为VIP会员查看完整内容
0
142

在Python中获得操作、处理、清理和处理数据集的完整说明。本实用指南的第二版针对Python 3.6进行了更新,其中包含了大量的实际案例研究,向您展示了如何有效地解决广泛的数据分析问题。在这个过程中,您将学习最新版本的panda、NumPy、IPython和Jupyter。

本书由Python panda项目的创建者Wes McKinney编写,是对Python中的数据科学工具的实用的、现代的介绍。对于刚接触Python的分析人员和刚接触数据科学和科学计算的Python程序员来说,它是理想的。数据文件和相关材料可以在GitHub上找到。

  • 使用IPython外壳和Jupyter笔记本进行探索性计算
  • 学习NumPy (Numerical Python)中的基本和高级特性
  • 开始使用pandas库的数据分析工具
  • 使用灵活的工具来加载、清理、转换、合并和重塑数据
  • 使用matplotlib创建信息可视化
  • 应用panda groupby工具对数据集进行切片、切割和汇总
  • 分析和处理有规律和不规则的时间序列数据
  • 学习如何解决现实世界的数据分析问题与彻底的,详细的例子
成为VIP会员查看完整内容
0
124

斯坦福大学Stephen Boyd教授与加州大学Lieven Vandenberghe教授合著的应用线性代数导论:向量、矩阵和最小二乘法《Introduction to Applied Linear Algebra – Vectors, Matrices, and Least Squares》在2018年由剑桥大学出版社发行,开源书包含19章,473页pdf,这本书的目的是提供一个介绍向量,矩阵,最小二乘方法,应用线性代数的基本主题。目标是让学生通俗易懂,入门学习。让学习者了解在包括数据拟合、机器学习和人工智能,断层、导航、图像处理、金融、和自动控制系统的应用。是一本不可多得好教材。​

Stephen P. Boyd是斯坦福大学电子工程Samsung 教授,信息系统实验室电子工程教授,斯坦福大学电子工程系系主任。他在管理科学与工程系和计算机科学系任职,是计算与数学工程研究所的成员。他目前的研究重点是凸优化在控制、信号处理、机器学习和金融方面的应用。 https://web.stanford.edu/~boyd/

Lieven Vandenberghe,美国加州大学洛杉矶分校电子与计算机工程系和数学系教授

这本书的目的是提供一个介绍向量,矩阵,最小二乘方法,应用线性代数的基本主题。我们的目标是让很少或根本没有接触过线性代数的学生快速学习,以及对如何使用它们在许多应用程序中, 包括数据拟合、机器学习和人工智能, 断层、导航、图像处理、金融、和自动控制系统。

读者所需要的背景知识是熟悉基本的数学符号。我们只在少数地方使用微积分,但它并不是一个关键的角色,也不是一个严格的先决条件。虽然这本书涵盖了许多传统上作为概率和统计的一部分来教授的话题,比如如何将数学模型与数据相匹配,但它并不需要概率和统计方面的知识或背景。

这本书涉及的数学比应用线性代数的典型文本还少。我们只使用线性代数中的一个理论概念,线性无关,和一个计算工具,QR分解;我们处理大多数应用程序的方法只依赖于一种方法,即最小二乘(或某种扩展)。从这个意义上说,我们的目标是知识经济:仅用一些基本的数学思想、概念和方法,我们就涵盖了许多应用。然而,我们所提供的数学是完整的,因为我们仔细地证明了每一个数学命题。然而,与大多数介绍性的线性代数文本不同,我们描述了许多应用程序,包括一些通常被认为是高级主题的应用程序,如文档分类、控制、状态估计和组合优化。

这本书分为三部分。第一部分向读者介绍向量,以及各种向量运算和函数,如加法、内积、距离和角度。我们还将描述如何在应用程序中使用向量来表示文档中的字数、时间序列、病人的属性、产品的销售、音轨、图像或投资组合。第二部分对矩阵也做了同样的处理,最终以矩阵的逆和求解线性方程的方法结束。第三部分,关于最小二乘,是回报,至少在应用方面。我们展示了近似求解一组超定方程的简单而自然的思想,以及对这一基本思想的一些扩展,可以用来解决许多实际问题。

成为VIP会员查看完整内容
0
176
小贴士
相关VIP内容
专知会员服务
61+阅读 · 3月5日
专知会员服务
65+阅读 · 2月28日
专知会员服务
69+阅读 · 2020年12月6日
专知会员服务
77+阅读 · 2020年12月3日
专知会员服务
65+阅读 · 2020年11月27日
专知会员服务
96+阅读 · 2020年10月28日
专知会员服务
47+阅读 · 2020年9月20日
专知会员服务
142+阅读 · 2020年4月29日
【经典书】Python数据数据分析第二版,541页pdf
专知会员服务
124+阅读 · 2020年3月12日
相关论文
Jan Toenshoff,Neta Friedman,Martin Grohe,Benny Kimelfeld
0+阅读 · 3月11日
Sergio M. Martin,Daniel Wälchli,Georgios Arampatzis,Athena E. Economides,Petr Karnakov,Petros Koumoutsakos
0+阅读 · 3月11日
Valerie Chen,Jeffrey Li,Joon Sik Kim,Gregory Plumb,Ameet Talwalkar
0+阅读 · 3月10日
Factor Graph Attention
Idan Schwartz,Seunghak Yu,Tamir Hazan,Alexander Schwing
5+阅读 · 2019年4月11日
Parsimonious Bayesian deep networks
Mingyuan Zhou
3+阅读 · 2018年10月17日
Rui Zhao,Volker Tresp
3+阅读 · 2018年10月8日
Alexander Jung
15+阅读 · 2018年8月19日
Tran Dang Quang Vinh,Tuan-Anh Nguyen Pham,Gao Cong,Xiao-Li Li
12+阅读 · 2018年4月18日
Yan Li,Junge Zhang,Kaiqi Huang,Jianguo Zhang
5+阅读 · 2018年3月13日
Olivier Gouvert,Thomas Oberlin,Cédric Févotte
8+阅读 · 2018年1月5日
Top