《现代统计学导论》是对之前的游戏《统计学与随机化和模拟导论》的重新构想。这本新书着重强调了探索性数据分析(特别是使用可视化、摘要和描述性模型探索多元关系),并提供了使用随机化和引导的基于模拟的推理的全面讨论,接着介绍了基于中心极限定理的相关方法。

第1部分:数据介绍。数据结构、变量、摘要、图形、基本数据收集和研究设计技术。 第2部分:探索性数据分析。数据可视化和总结,特别强调多变量关系。 第3部分:回归建模。用线性和逻辑回归建模数值和分类结果,并使用模型结果来描述关系和作出预测。 第4部分:推理的基础。案例研究被用来引入随机测试、bootstrap间隔和数学模型的统计推理的思想。 第5部分:统计推断。使用随机化测试、引导间隔和数值和分类数据的数学模型的统计推断的进一步细节。 第6部分:推理建模。扩展推理技术提出了迄今为止的线性和逻辑回归设置和评估模型性能。

我们希望读者能从本书中汲取三种思想,并为统计学的思维和方法打下基础。

  1. 统计学是一个具有广泛实际应用的应用领域。

  2. 你不必成为数学大师,也可以从有趣的、真实的数据中学习。

  3. 数据是混乱的,统计工具是不完善的。

地址:

https://www.openintro.org/book/ims/

成为VIP会员查看完整内容
0
35

相关内容

这本书的故事始于我被指派在佛罗里达州立大学教授一门金融数学入门课程。最初,这门课的内容是测量理论、集成和随机分析。然后,它发展到包括测度理论,一些概率论,二项模型中的期权定价。当我接手这门课程时,我不确定我要做什么。然而,我的愿景是在保留经典的风险管理材料的同时,教授学生一些新的金融数学主题。

这本书的前两章只要求微积分和概率论,可以教高年级本科生。在附录的a .1和B节中也有对这些主题的简要回顾。我在附录中尽量简短;许多书籍,包括金融随机微积分I([27,28])和凸优化([8]),涵盖了这些主题广泛。第一章的主要目标是使读者熟悉金融数学中风险管理的基本概念。所有这些概念首先是在一个相对非技术的一个时期框架,如马科维茨投资组合多样化或阿罗-德布鲁市场模型。第二章将Arrow-Debreu市场模型的关键结果推广到多周期情况,并介绍了多周期二项式模型及其数值方法。第3章讨论了更高级的概率主题,这些主题将在附录B和C部分的剩余部分介绍。这一章更适合研究生。在第3.2节中,我们首先通过Bachelier模型建立了连续时间中重要的概念和计算方法。然后,我们在第3.3节中提供了更现实的Black-Scholes模型的概要。第四章讨论了一种特定的金融衍生品的定价:美国期权。第4.0.1和4.1节可以在完成第2章后直接学习。本节的其余部分需要理解第3.3节作为先决条件。

成为VIP会员查看完整内容
0
33

近年来,自然语言处理的研究方法取得了一些突破。这些突破来源于两个新的建模框架以及在计算和词汇资源的可用性的改进。在这个研讨会小册子中,我们将回顾这些框架,以一种可以被视为现代自然语言处理开端的方法论开始:词嵌入。我们将进一步讨论将嵌入式集成到端到端可训练方法中,即卷积神经网络和递归神经网络。这本小册子的第二章将讨论基于注意力的模型的影响,因为它们是最近大多数最先进的架构的基础。因此,我们也将在本章中花很大一部分时间讨论迁移学习方法在现代自然语言处理中的应用。最后一章将会是一个关于自然语言生成的说明性用例,用于评估最先进的模型的训练前资源和基准任务/数据集。

https://compstat-lmu.github.io/seminar_nlp_ss20/

在过去的几十年里,人工智能技术的重要性和应用不断得到关注。在当今时代,它已经与构成人类塑造环境的大部分环境密不可分。因此,商业、研究和开发、信息服务、工程、社会服务和医学等无数部门已经不可逆转地受到人工智能能力的影响。人工智能有三个主要领域组成了这项技术:语音识别、计算机视觉和自然语言处理(见Yeung (2020))。在这本书中,我们将仔细研究自然语言处理(NLP)的现代方法。

这本小册子详细介绍了用于自然语言处理的现代方法,如深度学习和迁移学习。此外,本研究亦会研究可用于训练自然语言处理任务的资源,并会展示一个将自然语言处理应用于自然语言生成的用例。

为了分析和理解人类语言,自然语言处理程序需要从单词和句子中提取信息。由于神经网络和其他机器学习算法需要数字输入来进行训练,因此应用了使用密集向量表示单词的词嵌入。这些通常是通过有多个隐藏层的神经网络学习的,深度神经网络。为了解决容易的任务,可以应用简单的结构神经网络。为了克服这些简单结构的局限性,采用了递归和卷积神经网络。因此,递归神经网络用于学习不需要预先定义最佳固定维数的序列的模型,卷积神经网络用于句子分类。第二章简要介绍了NLP中的深度学习。第三章将介绍现代自然语言处理的基础和应用。在第四章和第五章中,将解释和讨论递归神经网络和卷积神经网络及其在自然语言处理中的应用。

迁移学习是每个任务或领域的学习模型的替代选择。在这里,可以使用相关任务或领域的现有标记数据来训练模型,并将其应用到感兴趣的任务或领域。这种方法的优点是不需要在目标域中进行长时间的训练,并且可以节省训练模型的时间,同时仍然可以(在很大程度上)获得更好的性能。迁移学习中使用的一个概念是注意力,它使解码器能够注意到整个输入序列,或自注意,它允许一个Transformer 模型处理所有输入单词,并建模一个句子中所有单词之间的关系,这使得快速建模一个句子中的长期依赖性成为可能。迁移学习的概念将在小册子的第6章简要介绍。第七章将通过ELMo、ULMFiT和GPT模型来描述迁移学习和LSTMs。第八章将详细阐述注意力和自注意力的概念。第九章将迁移学习与自注意力相结合,介绍了BERT模型、GTP2模型和XLNet模型。

为NLP建模,需要资源。为了找到任务的最佳模型,可以使用基准测试。为了在基准实验中比较不同的模型,需要诸如精确匹配、Fscore、困惑度或双语评估替补学习或准确性等指标。小册子的第十章简要介绍了自然语言处理的资源及其使用方法。第11章将解释不同的指标,深入了解基准数据集SQuAD、CoQa、GLUE和SuperGLUE、AQuA-Rat、SNLI和LAMBADA,以及可以找到资源的预训练模型和数据库,如“带代码的论文”和“大坏的NLP数据库”。

在小册子的最后一章中,介绍了生成性NLP处理自然语言生成,从而在人类语言中生成可理解的文本。因此,不同的算法将被描述,聊天机器人和图像字幕将被展示,以说明应用的可能性。

本文对自然语言处理中各种方法的介绍是接下来讨论的基础。小册子的各个章节将介绍现代的NLP方法,并提供了一个更详细的讨论,以及各种示例的潜力和限制。

成为VIP会员查看完整内容
0
131

概率论起源于17世纪的法国,当时两位伟大的法国数学家,布莱斯·帕斯卡和皮埃尔·德·费马,对两个来自机会博弈的问题进行了通信。帕斯卡和费马解决的问题继续影响着惠更斯、伯努利和DeMoivre等早期研究者建立数学概率论。今天,概率论是一个建立良好的数学分支,应用于从音乐到物理的学术活动的每一个领域,也应用于日常经验,从天气预报到预测新的医疗方法的风险。

本文是为数学、物理和社会科学、工程和计算机科学的二、三、四年级学生开设的概率论入门课程而设计的。它提出了一个彻底的处理概率的想法和技术为一个牢固的理解的主题必要。文本可以用于各种课程长度、水平和重点领域。

在标准的一学期课程中,离散概率和连续概率都包括在内,学生必须先修两个学期的微积分,包括多重积分的介绍。第11章包含了关于马尔可夫链的材料,为了涵盖这一章,一些矩阵理论的知识是必要的。

文本也可以用于离散概率课程。材料被组织在这样一种方式,离散和连续的概率讨论是在一个独立的,但平行的方式,呈现。这种组织驱散了对概率过于严格或正式的观点,并提供了一些强大的教学价值,因为离散的讨论有时可以激发更抽象的连续的概率讨论。在离散概率课程中,学生应该先修一学期的微积分。

为了充分利用文中的计算材料和例子,假设或必要的计算背景很少。所有在文本中使用的程序都是用TrueBASIC、Maple和Mathematica语言编写的。

成为VIP会员查看完整内容
0
53

金融数学导论:概念和计算方法是金融数学的入门课程,侧重于模型的概念理解和问题解决。它包括风险管理所需的数学背景,如概率论、最优化等。这本书的目标是向读者展示广泛的基本问题,其中一些强调分析能力,一些需要编程技术和其他侧重于统计数据分析。此外,它还涵盖了主流金融数学教材之外的一些领域。如CCP的边际账户设置和系统风险,以及模型风险的简要概述。为了帮助学生为本书的考试做准备,我们还提供了一些练习和例子。

目录内容: 1 Preliminaries of finance and risk managemet 2 Modeling financial assets in discrete-time markets 3 Modelling financial asserts in cotinuous-time 4 American options

成为VIP会员查看完整内容
0
36

这是一本关于理论计算机科学的本科入门课程的教科书。这本书的教育目的是传达以下信息:

• 这种计算出现在各种自然和人为系统中,而不仅仅是现代的硅基计算机中。 • 类似地,除了作为一个极其重要的工具,计算也作为一个有用的镜头来描述自然,物理,数学,甚至社会概念。 • 许多不同计算模型的普遍性概念,以及代码和数据之间的二元性相关概念。 • 一个人可以精确地定义一个计算的数学模型,然后用它来证明(有时只是猜测)下界和不可能的结果。 • 现代理论计算机科学的一些令人惊讶的结果和发现,包括np完备性的流行、交互作用的力量、一方面的随机性的力量和另一方面的去随机化的可能性、在密码学中“为好的”使用硬度的能力,以及量子计算的迷人可能性。

成为VIP会员查看完整内容
0
64

本课程的教材是从机器学习的角度写的,是为那些有必要先决条件并对学习因果关系基础感兴趣的人而开设的。我尽我最大的努力整合来自许多不同领域的见解,利用因果推理,如流行病学、经济学、政治学、机器学习等。

有几个主要的主题贯穿全课程。这些主题主要是对两个不同类别的比较。当你阅读的时候,很重要的一点是你要明白书的不同部分适合什么类别,不适合什么类别。

统计与因果。即使有无限多的数据,我们有时也无法计算一些因果量。相比之下,很多统计是关于在有限样本中解决不确定性的。当给定无限数据时,没有不确定性。然而,关联,一个统计概念,不是因果关系。在因果推理方面还有更多的工作要做,即使在开始使用无限数据之后也是如此。这是激发因果推理的主要区别。我们在这一章已经做了这样的区分,并将在整本书中继续做这样的区分。

识别与评估。因果效应的识别是因果推论所独有的。这是一个有待解决的问题,即使我们有无限的数据。然而,因果推理也与传统统计和机器学习共享估计。我们将主要从识别因果效应(在第2章中,4和6)之前估计因果效应(第7章)。例外是2.5节和节4.6.2,我们进行完整的例子估计给你的整个过程是什么样子。

介入与观察。如果我们能进行干预/实验,因果效应的识别就相对容易了。这很简单,因为我们可以采取我们想要衡量因果效应的行动,并简单地衡量我们采取行动后的效果。观测数据变得更加复杂,因为数据中几乎总是引入混杂。

假设。将会有一个很大的焦点是我们用什么假设来得到我们得到的结果。每个假设都有自己的框来帮助人们注意到它。清晰的假设应该使我们很容易看到对给定的因果分析或因果模型的批评。他们希望,清晰地提出假设将导致对因果关系的更清晰的讨论。

成为VIP会员查看完整内容
0
89

有几个主要的主题贯穿全书。这些主题主要是对两个不同类别的比较。当你阅读的时候,很重要的一点是你要明白书的不同部分适合什么类别,不适合什么类别。

统计与因果。即使有无限多的数据,我们有时也无法计算一些因果量。相比之下,很多统计是关于在有限样本中解决不确定性的。当给定无限数据时,没有不确定性。然而,关联,一个统计概念,不是因果关系。在因果推理方面还有更多的工作要做,即使在开始使用无限数据之后也是如此。这是激发因果推理的主要区别。我们在这一章已经做了这样的区分,并将在整本书中继续做这样的区分。

识别与评估。因果效应的识别是因果推论所独有的。这是一个有待解决的问题,即使我们有无限的数据。然而,因果推理也与传统统计和机器学习共享估计。我们将主要从识别因果效应(在第2章中,4和6)之前估计因果效应(第7章)。例外是2.5节和节4.6.2,我们进行完整的例子估计给你的整个过程是什么样子。

介入与观察。如果我们能进行干预/实验,因果效应的识别就相对容易了。这很简单,因为我们可以采取我们想要衡量因果效应的行动,并简单地衡量我们采取行动后的效果。观测数据变得更加复杂,因为数据中几乎总是引入混杂。

假设。将会有一个很大的焦点是我们用什么假设来得到我们得到的结果。每个假设都有自己的框来帮助人们注意到它。清晰的假设应该使我们很容易看到对给定的因果分析或因果模型的批评。他们希望,清晰地提出假设将导致对因果关系的更清晰的讨论。

https://www.bradyneal.com/causal-inference-course

成为VIP会员查看完整内容
0
125

这本书的第五版继续讲述如何运用概率论来深入了解真实日常的统计问题。这本书是为工程、计算机科学、数学、统计和自然科学的学生编写的统计学、概率论和统计的入门课程。因此,它假定有基本的微积分知识。

第一章介绍了统计学的简要介绍,介绍了它的两个分支:描述统计学和推理统计学,以及这门学科的简短历史和一些人,他们的早期工作为今天的工作提供了基础。

第二章将讨论描述性统计的主题。本章展示了描述数据集的图表和表格,以及用于总结数据集某些关键属性的数量。

为了能够从数据中得出结论,有必要了解数据的来源。例如,人们常常假定这些数据是来自某个总体的“随机样本”。为了确切地理解这意味着什么,以及它的结果对于将样本数据的性质与整个总体的性质联系起来有什么意义,有必要对概率有一些了解,这就是第三章的主题。本章介绍了概率实验的思想,解释了事件概率的概念,并给出了概率的公理。

我们在第四章继续研究概率,它处理随机变量和期望的重要概念,在第五章,考虑一些在应用中经常发生的特殊类型的随机变量。给出了二项式、泊松、超几何、正规、均匀、伽玛、卡方、t和F等随机变量。

成为VIP会员查看完整内容
2
128

从生态系统中的捕食者-被捕食者数量,到体内的激素调节,自然界中充满了对我们产生深远影响的动力系统。这本书为在生命科学中描述这些相互作用的系统并理解和预测他们的行为的学生开发必要的数学工具。复杂的反馈关系和反直觉的反应在自然界的动力系统中是常见的; 这本书发展了需要探索这些相互作用的定量技能。

微分方程是量化变化的自然数学工具,也是贯穿全书的驱动力。欧拉方法的使用使非线性实例易于处理,并可用于早期本科生的广泛范围,从而提供了一种实用的替代传统微积分课程的程序方法。工具是在大量的,相关的例子中开发的,并强调整个数学模型的构建、评估和解释。在情境中遇到这些概念,学生不仅学习定量技术,而且学习如何在生物学和数学思维方式之间架起桥梁。

例子范围广泛,探索神经元和免疫系统的动力学,通过人口动力学和谷歌PageRank算法。每个场景只依赖于对自然世界的兴趣;学生或教师不假定有生物学专业知识。建立在一个单一的预微积分的前提下,这本书适合两个季度的序列为一或二年级本科生,并满足数学要求的医学院入学。后面的材料为数学和生命科学的更高级的学生提供了机会,在一个丰富的、真实世界的框架中重温理论知识。在所有情况下,焦点都很清楚:数学如何帮助我们理解科学?

成为VIP会员查看完整内容
0
42
小贴士
相关主题
相关VIP内容
专知会员服务
35+阅读 · 5月11日
专知会员服务
131+阅读 · 2月22日
专知会员服务
53+阅读 · 2020年11月25日
专知会员服务
36+阅读 · 2020年11月16日
专知会员服务
64+阅读 · 2020年9月17日
专知会员服务
89+阅读 · 2020年9月1日
专知会员服务
125+阅读 · 2020年8月25日
专知会员服务
128+阅读 · 2020年7月28日
相关论文
Learning stable reduced-order models for hybrid twins
Abel Sancarlos,Morgan Cameron,Jean-Marc Le Peuvedic,Juliette Groulier,Jean-Louis Duval,Elias Cueto,Francisco Chinesta
0+阅读 · 7月21日
Alessandro Sordoni,Nouha Dziri,Hannes Schulz,Geoff Gordon,Phil Bachman,Remi Tachet
7+阅读 · 6月25日
Alon Shoshan,Nadav Bhonker,Igor Kviatkovsky,Gerard Medioni
4+阅读 · 1月7日
Prithviraj Ammanabrolu,Wesley Cheung,William Broniec,Mark O. Riedl
7+阅读 · 2020年12月30日
Training Generative Adversarial Networks Via Turing Test
Jianlin Su
3+阅读 · 2018年10月25日
Pankaj Gupta,Subburam Rajaram,Hinrich Schütze,Bernt Andrassy
4+阅读 · 2018年5月1日
Jiaxuan You,Rex Ying,Xiang Ren,William L. Hamilton,Jure Leskovec
4+阅读 · 2018年2月24日
Peter J. Liu,Mohammad Saleh,Etienne Pot,Ben Goodrich,Ryan Sepassi,Lukasz Kaiser,Noam Shazeer
6+阅读 · 2018年1月30日
Top