这本书的第五版继续讲述如何运用概率论来深入了解真实日常的统计问题。这本书是为工程、计算机科学、数学、统计和自然科学的学生编写的统计学、概率论和统计的入门课程。因此,它假定有基本的微积分知识。

第一章介绍了统计学的简要介绍,介绍了它的两个分支:描述统计学和推理统计学,以及这门学科的简短历史和一些人,他们的早期工作为今天的工作提供了基础。

第二章将讨论描述性统计的主题。本章展示了描述数据集的图表和表格,以及用于总结数据集某些关键属性的数量。

为了能够从数据中得出结论,有必要了解数据的来源。例如,人们常常假定这些数据是来自某个总体的“随机样本”。为了确切地理解这意味着什么,以及它的结果对于将样本数据的性质与整个总体的性质联系起来有什么意义,有必要对概率有一些了解,这就是第三章的主题。本章介绍了概率实验的思想,解释了事件概率的概念,并给出了概率的公理。

我们在第四章继续研究概率,它处理随机变量和期望的重要概念,在第五章,考虑一些在应用中经常发生的特殊类型的随机变量。给出了二项式、泊松、超几何、正规、均匀、伽玛、卡方、t和F等随机变量。

成为VIP会员查看完整内容
1
45

相关内容

本话题关于日常用语「概率」,用于讨论生活中的运气、机会,及赌博、彩票、游戏中的「技巧」。关于抽象数学概念「概率」的讨论,请转 概率(数学)话题。

解锁数据的力量,第二版继续使用这些直观的方法,如随机化和自举间隔介绍统计推断的基本思想。这些方法通过真实相关的例子被赋予生命,通过易于使用的统计软件,并可在课程的早期阶段使用。这个项目包括更传统的方法,如t检验,卡方文本等,但只有在学生对随机方法的推理有了强烈的直觉理解之后。整个课程的重点是数据分析,主要目标是让学生能够有效地收集数据,分析数据,并解释从数据中得出的结论。程序是由真实的数据和真实的应用驱动的。

成为VIP会员查看完整内容
0
29

这本书向读者介绍点估计、置信区间和统计检验。基于线性模型的一般理论,本文对以下内容进行了深入的概述:固定效应、随机效应和混合效应模型的方差分析;在扩展到非线性模型之前,回归分析也首先出现在具有固定、随机和混合效应的线性模型中;统计多决策问题,如统计选择程序(Bechhofer和Gupta)和顺序测试;从数理统计的角度设计实验。大多数分析方法都补充了最小样本量的公式。这些章节还包含了解答的提示练习。

成为VIP会员查看完整内容
1
25

管理统计和数据科学的原理包括:数据可视化;描述性措施;概率;概率分布;数学期望;置信区间;和假设检验。方差分析;简单线性回归;多元线性回归也包括在内。另外,本书还提供了列联表、卡方检验、非参数方法和时间序列方法。

教材:

  • 包括通常在入门统计学课程中涵盖的学术材料,但与数据科学扭曲,较少强调理论
  • 依靠Minitab来展示如何用计算机执行任务
  • 展示并促进来自开放门户的数据的使用
  • 重点是发展对程序如何工作的直觉
  • 让读者了解大数据的潜力和目前使用它的失败之处
成为VIP会员查看完整内容
0
27

《图像处理手册》一直被评为计算机图像处理的最佳整体介绍,涵盖二维(2D)和三维(3D)成像技术、图像打印和存储方法、图像处理算法、图像和特征测量、定量图像测量分析等等。

  • 比以前的版本有更多的计算密集型算法
  • 提供更好的组织,更多的定量结果,和最新发展的新材料
  • 包括在3D成像和在统计分析上彻底修改的一章完全重写的章节
  • 包含超过1700个参考文献的理论,方法,和应用在广泛的学科
  • 呈现了500多个全新的人物和图像,其中超过三分之二是彩色的

《图像处理手册》第七版提供一个可接近的和最新的图像处理的处理,提供广泛的覆盖和算法的比较,方法,和结果。

成为VIP会员查看完整内容
0
62

统计学习是一套以复杂数据建模和数据理解为目的的工具集,是近期才发展起来的统计学的一个新领域。本书出自统计学习领域声名显赫的几位专家,结合R语言介绍了分析大数据必不可少的工具,提供一些重要的建模和预测技术,并借助丰富的实验来解释如何用R语言实现统计学习方法。论题包括线性回归、分类、重抽样方法、压缩方法、基于树的方法、支持向量机、聚类等,作者借助彩图和实际案例直观解释这些方法。为了读者更好地理解书中内容,每章后还配有丰富的概念性和应用性练习题。

  书中内容与《The Elements of Statistical Learning》的大部分内容相同,但是本书起点低,弱化了数学推导的细节,更注重方法的应用,所以更适合作为入门教材。当然,这本《统计学习导论》不仅是优秀的“统计学习”或“机器学习”课程的教材,也是数据挖掘、数据分析等相关从业者不可或缺的参考书。

Gareth James 斯坦福大学统计学博士毕业,师从Trevor Hastie。现为南加州大学马歇尔商学院统计学教授,美国统计学会会士,数理统计协会终身会员,新西兰统计协会会员。《Statistica Sinica》、《Applications and Case Studies》、《Theory and Methods》等期刊的副主编。

  Daniela Witten 斯坦福大学统计学博士毕业,师从Robert Tibshirani。现为华盛顿大学生物统计学副教授,美国统计学会和国际数理统计协会会士,《Journal of Computational and Graphical Statistics》和《Biometrika》等期刊副主编。

  Trevor Hastie 美国统计学家和计算机科学家,斯坦福大学统计学教授,英国皇家统计学会、国际数理统计协会和美国统计学会会士。Hastie参与开发了 R 中的大部分统计建模软件和环境,发明了主曲线和主曲面。

  Robert Tibshirani 斯坦福大学统计学教授,国际数理统计协会、美国统计学会和加拿大皇家学会会士,1996年COPSS总统奖得主,提出lasso方法。Hastie和Tibshirani都是统计学习领域的泰山北斗,两人合著《The Elements of Statistical Learning》,还合作讲授斯坦福大学的公开课《统计学习》。  

成为VIP会员查看完整内容
0
59

在Python中获得操作、处理、清理和处理数据集的完整说明。本实用指南的第二版针对Python 3.6进行了更新,其中包含了大量的实际案例研究,向您展示了如何有效地解决广泛的数据分析问题。在这个过程中,您将学习最新版本的panda、NumPy、IPython和Jupyter。

本书由Python panda项目的创建者Wes McKinney编写,是对Python中的数据科学工具的实用的、现代的介绍。对于刚接触Python的分析人员和刚接触数据科学和科学计算的Python程序员来说,它是理想的。数据文件和相关材料可以在GitHub上找到。

  • 使用IPython外壳和Jupyter笔记本进行探索性计算
  • 学习NumPy (Numerical Python)中的基本和高级特性
  • 开始使用pandas库的数据分析工具
  • 使用灵活的工具来加载、清理、转换、合并和重塑数据
  • 使用matplotlib创建信息可视化
  • 应用panda groupby工具对数据集进行切片、切割和汇总
  • 分析和处理有规律和不规则的时间序列数据
  • 学习如何解决现实世界的数据分析问题与彻底的,详细的例子
成为VIP会员查看完整内容
0
59

近几十年来,数据缺失的问题引起了广泛关注。这个新版本由两个公认的专家在这个问题上提供了一个最新的实用方法处理缺失数据问题。将理论与应用相结合,作者Roderick Little和Donald Rubin回顾了该主题的历史方法,并描述了缺失值的多元分析的简单方法。然后,他们提供了一个连贯的理论来分析基于概率的问题,这些概率来自于数据的统计模型和缺失数据的机制,然后他们将该理论应用到广泛的重要缺失数据的问题。

统计分析与缺失的数据,第三版开始给读者介绍缺失数据和解决它的方法。它查看创建丢失数据的模式和机制,以及丢失数据的分类。然后,在讨论完整案例分析和可用案例分析(包括加权方法)之前,对实验中缺失的数据进行检查。新版本扩大了它的覆盖面,包括最近的工作,如不响应抽样调查,因果推理,诊断方法,灵敏度分析,在许多其他主题。

  • 一个更新的“经典”由著名的权威写的主题
  • 超过150个练习(包括许多新的)
  • 介绍了最近的一些重要方法的研究工作,如多重归算、加权的稳健替代方法和贝叶斯方法
  • 根据过去的学生反馈和课堂经验修改以前的主题
  • 包含一个更新和扩展的书目

2017年,国际统计研究所(International Statistical Institute)将卡尔·皮尔森奖(Karl Pearson Prize)授予了这两位作者,以表彰他们对统计理论、方法或应用产生深远影响的研究贡献。

第三版统计分析缺失的数据,是一个理想的教科书,为本科高年级和/或刚开始研究生水平的学科学生。它也是一个优秀的信息来源,为应用统计学家和在政府行业的从业人员提供参考。

成为VIP会员查看完整内容
0
45

对因果推理的简明和自成体系的介绍,在数据科学和机器学习中越来越重要。

因果关系的数学化是一个相对较新的发展,在数据科学和机器学习中变得越来越重要。这本书提供了一个独立的和简明的介绍因果模型和如何学习他们的数据。在解释因果模型的必要性,讨论潜在的因果推论的一些原则,这本书教读者如何使用因果模型:如何计算干预分布,如何从观测推断因果模型和介入的数据,和如何利用因果思想经典的机器学习问题。所有这些主题都将首先以两个变量的形式进行讨论,然后在更一般的多元情况下进行讨论。对于因果学习来说,二元情况是一个特别困难的问题,因为经典方法中用于解决多元情况的条件独立不存在。作者认为分析因果之间的统计不对称是非常有意义的,他们报告了他们对这个问题十年来的深入研究。

本书对具有机器学习或统计学背景的读者开放,可用于研究生课程或作为研究人员的参考。文本包括可以复制和粘贴的代码片段、练习和附录,其中包括最重要的技术概念摘要。

首先,本书主要研究因果关系推理子问题,这可能被认为是最基本和最不现实的。这是一个因果问题,需要分析的系统只包含两个可观测值。在过去十年中,作者对这个问题进行了较为详细的研究。本书整理这方面的大部分工作,并试图将其嵌入到作者认为对研究因果关系推理问题的选择性至关重要的更大背景中。尽管先研究二元(bivariate)案例可能有指导意义,但按照章节顺序,也可以直接开始阅读多元(multivariate)章节;见图一。

第二,本书提出的解决方法来源于机器学习和计算统计领域的技术。作者对其中的方法如何有助于因果结构的推断更感兴趣,以及因果推理是否能告诉我们应该如何进行机器学习。事实上,如果我们不把概率分布描述的随机实验作为出发点,而是考虑分布背后的因果结构,机器学习的一些最深刻的开放性问题就能得到最好的理解。
成为VIP会员查看完整内容
0
165
小贴士
相关主题
相关VIP内容
相关论文
Visualizing and Measuring the Geometry of BERT
Andy Coenen,Emily Reif,Ann Yuan,Been Kim,Adam Pearce,Fernanda Viégas,Martin Wattenberg
5+阅读 · 2019年10月28日
Marc Everett Johnson
3+阅读 · 2018年12月18日
dynnode2vec: Scalable Dynamic Network Embedding
Sedigheh Mahdavi,Shima Khoshraftar,Aijun An
5+阅读 · 2018年12月6日
Generating Realistic Geology Conditioned on Physical Measurements with Generative Adversarial Networks
Emilien Dupont,Tuanfeng Zhang,Peter Tilke,Lin Liang,William Bailey
6+阅读 · 2018年7月5日
Mo Yu,Xiaoxiao Guo,Jinfeng Yi,Shiyu Chang,Saloni Potdar,Yu Cheng,Gerald Tesauro,Haoyu Wang,Bowen Zhou
6+阅读 · 2018年5月19日
Ryota Yoshihashi,Tu Tuan Trinh,Rei Kawakami,Shaodi You,Makoto Iida,Takeshi Naemura
3+阅读 · 2018年5月15日
Jianming Lv,Weihang Chen,Qing Li,Can Yang
6+阅读 · 2018年3月20日
Alexandre Attia,Sharone Dayan
3+阅读 · 2018年1月19日
Top